2009-03-19 5 views
0
xsltCopyText: text allocation failed 
runtime error: element value-of 
xsltValueOf: text copy failed 

Vous avez cette erreur lors de l'analyse XML (wikipedia dump, en fait) avec XMLStarlet. Je peux obtenir des titres de page et des identifiants, mais quand il s'agit de textes de page, cela échoue.XMLStarlet: erreur d'analyse XML

Expression utilisée:

xml sel -N xmlns=http://www.mediawiki.org/xml/export-0.3/ -T -t -m "//xmlns:revision" -v "xmlns:text" -n d:\wiki\translated.wiki.xml 

post-scriptum Je le fais sur Windows.

Répondre

2

Quel est le contenu de translated.wiki.xml? Il suffit de vérifier les premières lignes, il peut avoir été corrompu quelque part. Pouvez-vous reproduire le problème sur un petit sous-ensemble translated.wiki.xml? Wikipedia dumps sont énorme et souvent des outils de crash qui allouent la mémoire trop avidement.

+0

J'ai validé translate.wiki.xml avec XMLStarlet, et c'est cohérent. Oui, cela fonctionne correctement sur un petit sous-ensemble. Doit être des problèmes de mémoire. Stupide, stupide moi :) –

+0

D'accord, problème résolu en utilisant Xalan (avec XSLT généré par XML Starlet). –

Questions connexes