2009-07-16 5 views
0

J'ai écrit un script bash shell qui lit un répertoire et analyse tous les fichiers XML dans une boucle for. Je prends chaque fichier XML et l'envoie à xsltproc avec une feuille de style xsl. Le problème est que certains fichiers xml ont des caractères non UTF 8 et que l'analyseur est incapable d'ouvrir ces fichiers. Une erreur d'analyseur est lancée indiquant que l'encodage UTF 8 est attendu.peut xsltproc être utilisé pour analyser des fichiers xml non UTF 8

Y at-il une option disponible où je peux demander à xsltproc de traiter ces fichiers.

Une option de plus est-ce que je peux demander à mon xsl de ne lire que les balises que je veux et pas tout le fichier xml? est-ce la xsl façon dont fonctionne ou je peux me tromper trop

S'il vous plaît aidez-moi

+1

Avez-vous essayé de calculer votre encodage de fichier et utilisez l'option --encoding de xsltproc? – neuro

+0

Pouvez-vous poster les premières lignes d'un de vos fichiers XML/XSL? –

Répondre

1

Si vous pouvez identifier les non-UTF-8 fichiers et connaître l'encodage qu'ils sont, puis le traitement de ces fichiers avec

iconv -f [encoding] -t UTF-8 < [file] | xsltproc ... 

au lieu d'une invocation nue xsltproc devrait vous faire.

Questions connexes