0

Voici mon code:lecture du fichier chaque ligne à la liste en Python

with open(path) as file: 
    lines = file.readlines() 
    print lines[0:5] 

Cependant, je reçois beaucoup de caractères supplémentaires, par exemple:

['cat2\xc2\xa0\xc2\xa0 2\xc2\xa0 0', 'cat1\xc2\xa00.5\xc2\xa0 0', 'cat2\xc2\xa0\xc2\xa0 1\xc2\xa0 0', 'cat1\xc2\xa0\xc2\xa0 0\xc2\xa0 0', 'cat2\xc2\xa0\xc2\xa0 0\xc2\xa0 3'] 

Pourquoi dois-je les obtenir?

Le fichier texte original était le suivant:

cat2   2  0 
cat1 0.5  0 
cat2   1  0 
cat1   0  0 
cat2   0  3 
+0

semble que vous avez d'étranges caractères dans votre fichier ... –

+0

Pour celui qui essaie de rouvrir ce: Tous les ingrédients pour résoudre ce sont les doublons liés. –

Répondre

2

\xc2\xa0 est un non-breaking space. Remplacez-le par des espaces réguliers dans le fichier.

Cette séquence apparaît dans de nombreux codages incluant UTF-8.

En savoir plus sur Wikipedia

+0

Pouvez-vous s'il vous plaît ajouter dans quel format ces caractères sont trouvés? – Prajwal