Quelle est la méthode préférée pour extraire des éléments d'une page HTML en Java?meilleur moyen d'extraire des éléments d'une page html?
Mon HTML est a plusieurs des lignes suivantes:
<tr class="item-odd">
<td class="data"><a href="http://.....">TITLE</a></td>
<td><div class="cost">$1.99</div></td>
</tr>
alterne classe item-odd
et item-even.
J'ai besoin d'extraire:
- Url
- Titre
- prix
Les expressions régulières sont-elles le chemin à parcourir?
Non, pas regex. http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 –
Selon votre page d'activité utilisateur, vous avez posé pas moins de 24 questions dans les dernières 24 heures. Avez-vous déjà pensé à peut-être répondre à une question de temps en temps juste pour des coups de pied? –
oui j'y ai pensé. – mrblah