Android: проанализировать HTML-код кода

У меня есть следующий fragment кода HTML, который мне нужно проанализировать, чтобы получить имя игрока и результаты, которые он забил. В этом случае это «Росс Тейлор» и 9. Каков наилучший способ проанализировать эту информацию? Не хотите использовать парсер HTML. Является ли REGEX лучшим способом (я знаю, что люди мертвы против этого! Но я просто хочу эти 2 бита информации и, следовательно, не хочу использовать парсер)? Я ломаю себе голову над тем, как я должен выяснить, где имя игрока находится в html-файле, и последовательная строка, на которой есть заработанные трассы. Компонент комментария HTML ниже является жестко закодированным. Я могу добраться до этого места. Затем найдите имя между тегами. Это хороший способ сделать это? Также как я могу получить часть выполнения в ближайшей следующей строке?


<!-- *Luke Woodcock-->  *Ross Taylor  (lhb)  9 9 1 0 100.00  striker    

Пожалуйста, дайте мне знать, если вам нужна дополнительная информация.

С уважением, Сэм

Каков наилучший способ проанализировать эту информацию?

Используйте парсер HTML.

Не хотите использовать парсер HTML.

Я не согласен.

Является ли REGEX лучшим способом

Нет .

Пожалуйста, рассмотрите возможность использования подходящего инструмента для задания, например html/xml parser не regex .

Если вы действительно хотите это сделать с помощью regex, вы можете попробовать следующее:

Выдержка

  (?< =\\)\\d+(?=\\) 

Извлечь имя игрока

  (?< =\\>)[^\\< ]+(?=\\) 

Второе регулярное выражение предположило, что вы дезинфицировали xml, удалив привязку между тегами комментариев.

   

Что он делает, он извлекает значение в любом якоре. Это одно из основных ограничений при использовании регулярного выражения, оно не является контекстно-зависимым.

Для чего это стоит, вы также можете взглянуть на Jsoup . Я использовал его в своих проектах, и он отлично справляется с искаженным html. Я считаю, что это единственная причина, по которой я его использую;)

С уважением, EZFrag