2010-11-28 6 views
0

Je travaille avec de gros fichiers en français et en allemand. Fondamentalement, l'écriture de chaînes de caractères d'un fichier à l'autre, la collecte de données à partir d'eux, et ainsi de suite. Malheureusement, je n'ai aucune idée de ce qu'il faut importer pour permettre à Python de gérer ces caractères.Python - Comment encoder des caractères étrangers au format Python peut-il fonctionner?

Même lors de la collecte des données à partir de fichiers que Python a déjà converti (en français, vous obtenez des choses étranges comme à © Couteur ça), je reçois des erreurs clés lors de la vérification dicts des choses que je connais ont déjà été placés dans qui dictent, mais seulement quand les objets ont des caractères spéciaux comme dans l'exemple d'écuyer. Par exemple, lorsque le tuple ('à © couteur', 'ça') a à © tà © ajoutà © à un dict qui recueille la frà © quence que toute paire de mots se produit ensemble, vous obtenez une erreur de touche lors de l'à © tude dict pour le tuple ('à © couteur', 'ça'), mais pas lors de la tentative de dict pour les autres tuples qui ne contiennent pas les caractères farfelus.

Est-ce que quelqu'un connaît un moyen rapide de contourner ce problème à tous les niveaux?

Best, Georgina

+0

Pouvez-vous donner un exemple (de l'extrait de code) ce qui ne fonctionne pas exactement, à savoir les résultats que vous obtenez et quels sont les résultats que vous attendez. – ecik

+0

@ecik Merci. J'ai ajouté ceci au message original: Par exemple, quand le tuple ('à © couteur', 'ça') a à © tà © ajoutà © à un dict qui recueille la frà © quence qu'une paire de mots donnà © e se produit ensemble, vous obtenez une cle Erreur lors de la vérification du dicton ('à © couteur', 'ça'), mais pas lors de l'exploration de la dict pour les autres tuples qui ne contiennent pas les caractères farfelus. – Georgina

Répondre

Questions connexes