J'ai données hébraïques telle que \ xE0 est le aleph Hebrew, et souhaitez le convertir en utf-8comment convertir Hebrew 8 bits utf-8 en python
3
A
Répondre
7
En général en Python, si vous avoir une chaîne d'octets dont vous avez besoin d'utiliser d'abord le décoder pour le convertir en représentation interne, ensuite vous pouvez l'encoder en UTF-8. Bien sûr, vous devez connaître le codage de \xe0
pour que cela fonctionne (je suppose que votre personnage est codé en utilisant ISO-8859-8):
'\xe0'.decode('iso-8859-8').encode('utf-8')
EDIT: Une note de côté:
Assurez-vous d'utiliser la représentation interne dans votre programme aussi longtemps que possible. En général: décoder d'abord (en entrée), encoder en dernier (en sortie).
0
vous pouvez utiliser le « décodage » appel à la transformer en unicode
y = x.decode('iso8859-8')
où x
est votre chaîne à 8 bits et y
est la chaîne unicode alors vous pouvez le convertir en utf-8 en utilisant la encode
appel
z = y.encode('utf-8')
Questions connexes
- 1. Comment convertir 8 bits en 16 bits en VHDL?
- 2. Comment convertir 24 bits RVB en 8 bits RVB
- 3. Comment convertir UTF8 en Unicode
- 4. python entrée hebrew \ format
- 5. Besoin de convertir des données 16 bits en 8 bits
- 6. Convertir deux uint 8 bits en un uint 12 bits
- 7. Convertir des octets en bits en python
- 8. Convertir un codepoint unicode en hexadécimal UTF8 en python
- 9. Comment convertir IplImage à 3 voies en 8 bits?
- 10. Comment convertir un nombre en Python en 8 octets binaires (64 bits)?
- 11. Convertir latin1 en utf8?
- 12. Comment convertir ascii en utf8 avec maven
- 13. Comment convertir une chaîne en UTF8?
- 14. Convertir Unicode en UTF8
- 15. Comment convertir une chaîne utf-8 en big5 avec python?
- 16. Comment convertir une image .tiff 16 bits en une image .tiff 8 bits en Java?
- 17. Comment convertir UTF8 en LITUANIAN_CI_AS en PHP?
- 18. javascript: convertir la valeur hexadécimale en entier signé 8 bits
- 19. python pisa utf8 issue
- 20. AJAX + Hebrew
- 21. encodage Python ISO UTF8
- 22. Comment convertir des octets de 8 bits en caractères de 6 bits?
- 23. Comment convertir un IplImage * OpenCV 8 bits en un IplImage * 32 bits?
- 24. Convertir RGB565 en niveaux de gris (8 bits)
- 25. Convertir un octet Python en un "entier 8 bits non signé"
- 26. java: comment convertir un fichier en utf8
- 27. Comment convertir unicode en utf8 dans WP
- 28. Comment convertir une chaîne UTF8 en UTF16
- 29. Ruby on Rails convertir 1251 en UTF8
- 30. Python convertir html texte encodé ascii en utf8
Vous pouvez également jeter un oeil à [que] (http://stackoverflow.com/questions/368805/python-unicodedecodeerror-am-i-misunderstanding-encode/370199#370199) réponse . Notez également que vos chaînes sont très probablement codées en tant que 'cp1255' (voir [ici] (http://en.wikipedia.org/wiki/Windows-1255)), et non' iso8859-8'. – tzot