2013-04-29 6 views
0

J'utilise WebHarvest pour essayer de recevoir des données de Woot.com et je reçois quelques erreurs différentes. Je suis en mesure d'obtenir le site Web avec le premier processus, mais quand j'essaie de tester xpath à l'intérieur de la fenêtre de la variable, j'obtiens l'erreur org.xml.sax.SAXParseException; lineNumber: 86; columnNumber: 99; La référence à l'entité "pt2" doit se terminer par ";" délimiteur. Si j'essaie d'utiliser la jolie fonction d'impression, elle renvoie XML n'est pas bien formé: la référence à l'entité "pt2" doit se terminer par le ';' délimiteur. {ligne: 86, colonne: 99]. Enfin, à l'intérieur du script que j'écris, si je mets la balise xpath avec une expression, j'obtiens le type d'élément "xpath" doit être suivi par attributspecifications, ">" ou "/>". Quelqu'un peut-il me dire ce que je fais mal? Je suis très nouveau à WebHarvest et n'ai aucune expérience avec ce genre de programme.WebHarvest XML pas bien formé

Mon code est:

<?xml version="1.0" encoding="UTF-8"?><config> 
<xpath expression="(//div[@class="overview"])[1]//h2/text()"> 
<html-to-xml> 
<http url="http://www.woot.com/"/> 
</html-to-xml> 
</xpath> 
</config> 
+0

Veuillez partager votre fichier de configuration que vous avez créé pour obtenir la sortie désirée. Et laissez-nous savoir ce que vous voulez obtenir de Woot.com URL –

Répondre

0

Pour rendre le code XML bien formé vous avez utilisé &apos; au lieu de &quot; au sein de l'attribut expression. Et voilà:

<?xml version="1.0" encoding="UTF-8"?><config> 
<xpath expression="(//div[@class='overview'])[1]//h2/text()"> 
<html-to-xml> 
<http url="http://www.woot.com/"/> 
</html-to-xml> 
</xpath> 
</config> 

Vous pouvez utiliser &apos; ou &quot; pour envelopper un attribut. Mais, il ne peut pas être imbriqué de toute façon. Voici quelques exemples:

<xpath expression='(//div[@class="overview"])[1]//h2/text()'>   --- valid 
<xpath expression='(//div[@class='overview'])[1]//h2/text()'>   --- invalid 
<xpath expression="(//div[@class="overview"])[1]//h2/text()">   --- invalid 
<xpath expression='(//div[@class=&apos;overview&apos;])[1]//h2/text()'> --- valid 
<xpath expression="(//div[@class=&apos;overview&apos;])[1]//h2/text()"> --- valid 
<xpath expression="(//div[@class=&quot;overview&quot;])[1]//h2/text()"> --- valid 

Hope this helps.

+0

J'aurais dû le remarquer plus tôt, merci pour votre aide! – user2330657

Questions connexes