J'ai lu la chaîne à partir du fichier avec l'encodage "UTF-8". Et j'ai besoin de le faire correspondre à une expression. Le premier caractère du fichier est #
, mais dans la chaîne, le premier est ''
(symbole vide). Je l'ai traduit en octets avec le jeu de caractères "UTF-8", ici c'est [-17, -69, -65]
. Est-ce que quelqu'un sait ce que c'est et comment le résoudre avec regexprs?Caractères inconnus
3
A
Répondre
6
Certains éditeurs (comme le bloc-notes) ajoute une signature BOM (byte order mask) lors de l'enregistrement du texte UTF-8. Vous devriez vérifier 0xEF, 0xBB, 0xBF octets avant la chaîne de lecture d'un tel fichier et les ignorer s'ils existent. Une autre façon est de ne pas utiliser le bloc-notes pour éditer des textes UTF-8, obtenir un autre programme comme Notepad ++, Kate ou autre avec lequel vous pouvez contrôler l'ajout de BOM.
Questions connexes
- 1. PHPExcel caractères inconnus
- 2. Caractères d'espace convertis en caractères inconnus
- 3. caractères inconnus% 252B dans l'URL
- 4. pdf contient des caractères inconnus
- 5. Suppression de caractères inconnus d'un fichier texte
- 6. Problème avec l'envoi de courrier électronique, caractères inconnus!
- 7. exporté fichier Excel a générer des caractères inconnus
- 8. PHP Trouver une chaîne et suivre des caractères inconnus
- 9. URL Les caractères inconnus sont ajoutés pour demander des données
- 10. types inconnus C++
- 11. C# types inconnus
- 12. Django: Field Error Champs inconnus
- 13. Convertir des symboles inconnus cyrillique
- 14. Décoder les événements MIDI inconnus
- 15. XStreamMarshaller ignorer les éléments inconnus
- 16. API Facebook: champs inconnus: nom?
- 17. Objet désérialisant de types inconnus
- 18. Xcode montrant des personnages inconnus
- 19. Comment puis-je détecter les caractères Unicode inconnus/non attribués dans mon programme Java?
- 20. PHP obtenir une chaîne spécifique de l'URL avant et après les caractères inconnus
- 21. Caractères inconnus lors de la conversion de la chaîne codée au format Base64
- 22. Comment décoder des jeux de caractères multiples et inconnus en Python?
- 23. l'impression de caractères inconnus après la chaîne de lecture d'un fichier
- 24. Erreurs avec Java Swing - Changements inconnus
- 25. Sérialiser et désérialiser des types hérités inconnus
- 26. Pièges de sécurité PHP inconnus courants
- 27. Deserializing JSON avec des champs inconnus
- 28. Java Servlet Noms de tables inconnus MySQL
- 29. Appel du constructeur des enfants inconnus
- 30. Supprimer des fichiers inconnus dans Bazaar
Vous pouvez coller [hexdump] (http://en.wikipedia.org/wiki/Hex_dump) du début du fichier? C'est-à-dire que les données brutes avant Java le touchent même. –