2009-05-21 11 views
0

Cela semble être facile, mais j'ai du mal à nettoyer le caractère de retour à la ligne dans le contenu collé à partir de Microsoft Word. Pas un saut de ligne complet, mais le caractère CTRL ENTER qui apparaît comme une flèche de retour dans Word. J'ai essayé chr(10), chr(13), \u000D, \u000A et quelques autres, mais je ne peux pas le faire correspondre à un string.replace(). Dois-je chercher un caractère différent ou dois-je utiliser autre chose que la méthode string.replace?Remplacer le caractère Newline de Microsoft Word en Python

+0

Vous voulez donner quelques exemples? – sykora

+0

Peut être lu l'octet de texte par octet et l'ordinal d'impression de lui? pour c dans le texte: print ord (c) –

Répondre

4

Exécuter ceci:

print repr(mystringobject) 

qui donnera un soupçon de caractère que vous souhaitez supprimer.

Si toujours aucune idée, collez le résultat de la commande ci-dessus dans la question, et je vais modifier ma réponse.

+0

Merci à vous et Chris. C'était \ x0b – Tom

2

vous pouvez obtenir la valeur ASCII du caractère comme celui-ci:

for c in 'string': 
    print ord(c), hex(ord(c)) 

une fois que vous connaissez le code, il devrait être facile de tuer le délinquant.

Questions connexes