J'ai essayé d'analyser un document XML (HMTL en fait, mais cela n'a pas d'importance) en Java avec org.jdom2.input.SAXBuilder.Echec de l'analyse avec SAX en raison du caractère '&' en HTML
Le document contient une ligne avec une URL:
< link rel ="something" href="http://...&pg=2..." />;
Le problème est, il devrait avoir un point-virgule (;) après cela, si &pg
devient un symbole, et SAXBuilder donne une erreur à cause de cela (pas de point-virgule après & pg trouvé).
Existe-t-il une option d'analyse pour que SAX n'interprète pas le caractère &
comme un symbole, mais comme une chaîne normale?
La différence est, je ne veux pas Parse caractère spécial, je veux analyser les caractères &something
comme ils sont, il doit l'être par défaut en fait, et le principal problèmeest une exception lancé par la classe Java
org.jdom2.input.SAXBuilder
oui, par exemple netbeans xml editor écris la même chose à propos de; pg. Est-ce JSout parce que quelque chose ressemble à Element, donc vous pouvez naviguer vers les éléments? –
JSoup est un projet Apache, open-source. Son pour l'analyse HTML et navigue le DOM-aimé. Vous pouvez sélectionner différents nœuds, attributs et extraits de leurs données ... –