J'essaie de convertir les fichiers de syntaxe SPSS en HTML lisible. Cela fonctionne presque parfaitement, sauf qu'un caractère (unique) non imprimable est inséré dans le fichier HTML. Il ne semble pas avoir un code ASCII et ressemble à un petit point. Et ça cause des problèmes.Évitez les caractères non imprimables dans le fichier html écrit par Python
Il se produit (uniquement) dans la deuxième ligne du fichier HTML, correspondant toujours à la première ligne du fichier d'origine. Ce qui laisse deviner probablement à quelle ligne (s) de Python la cause du problème (s'il vous plaît voir les commentaires)
Le code qui semble provoquer c'est
rfil = open(fil,"r") #rfil = Read File, original syntax
wfil = open(txtFil,"w") #wfil = Write File, HTML output
#Line below causes problem??
wfil.write("<ol class='code'>\n<li>")
cnt = 0
for line in rfil:
if cnt == 0:
#Line below causes problem??
wfil.write(line.rstrip("\n").replace("'",''').replace('"','"'))
elif len(line) > 1:
wfil.write("</li>\n<li>" + line.strip("\n").replace("'",''').replace('"','"'))
else:
wfil.write("<br /><br />")
cnt += 1
wfil.write("</li>\n</ol>")
wfil.close()
rfil.close()
Capture d'écran du résultat
Que signifie "causer des problèmes" dans ce cas? Je suis un utf-8 fondamentaliste. Lorsque vous lisez en python, essayez de le convertir en utf-8 ou unicode en premier. Lorsque vous écrivez, utilisez toujours utf-8. Mais je ne sais pas vraiment si ce conseil répond à votre problème. –
Vous pouvez supprimer un fichier de fichiers non imprimables en utilisant: 'import string; "" .join (s pour s dans foo si s dans string.printable) '[Plus d'informations ici] (http://stackoverflow.com/a/16402009/1076493) – timss
@AdrianRatnapala:" Causing trouble "signifie que le non Le caractère imprimable est probablement inséré par cette ligne de code Python. Quand je regarde la page HTML finale dans le navigateur, cela se révèle vraiment bizarre et c'est ce que j'essaie de corriger. – RubenGeert