J'utilise Xpath (et java) pour extraire des informations de certains sites Web. Cependant, mon problème est que certains de ces sites n'étant pas bien formés, je ne peux pas les traiter. Existe-t-il un moyen d'éviter la vérification de la bonne forme ou de spécifier des étiquettes qui ne doivent pas être vérifiées pour leur bonne forme?comment ignorer la vérification du bon formatage XML
Merci Rp
Il y a en fait un port Java: http://sourceforge.net/projects/jtidy –