J'ai un système en python 2.5 qui traite les fichiers dans toutes les langues et l'encodage, je veux enregistrer certaines choses, et je ne suis pas vraiment intéressé par les caractères non standard, je ' Je suis prêt à utiliser uniquement des caractères ascii dans le journal, mais je reçois de temps en temps des erreurs comme.comment ajouter toutes les suites à une chaîne
<type 'tuple'>: (<type 'exceptions.UnicodeEncodeError'>, UnicodeEncodeError('ascii', u'Create project: 2016 May European Tour: There\u2019s Still Time to Buy Tickets!', 45, 46, 'ordinal not in range(128)'), <traceback object at 0x105b84908>)
Ceci est un exemple du code que j'ai essayé:
ceci fonctionne la plupart du temps, pas toujours
self.__log += data.decode('utf-8', 'ignore').encode("utf-8")
Cela a échoué, mais il a travaillé sur quelques don précédent 't travail
self.__log += data.encode('ascii', 'ignore')
Cela a fonctionné pour certains autres cas.
self.__log += data.decode('utf-8', 'replace')
le journal est en ce moment étant défini comme
self.__log = ""
Mais j'ai aussi essayé avec
self.__log = u""
Le problème est que je ne suis pas en mesure de créer une solution qui fonctionne pour tous les cas, que dois-je faire?
Comme toujours: arrêtez d'utiliser des chaînes d'octets. –
Je n'utilise pas d'octets, ils sont reçus des personnes qui utilisent le service. Je ne peux pas à ce sujet. –
ou est-il un moyen de dépouiller ces caractères? cela fonctionnera pour moi –