Est-ce qu'un fichier contient des données de différentes pages de codes?
Si oui, vous ne pouvez pas effectuer la conversion par lots. Vous devez connaître chaque codepage de chaque sous-chaîne de votre fichier.
Si aucun il est possible de convertir par lots un fichier à la fois, mais en supposant que vous savez ce que codepage ce fichier a. Nous sommes donc plus ou moins dans la même situation que ci-dessus, nous venons de déplacer l'abstraction de la portée de la sous-chaîne à la portée du fichier.
Donc, la question que vous devez vous poser est. Avez-vous des informations sur la page de code à laquelle certaines données appartiennent? Si ce n'est pas le cas, il aura toujours l'air fugace.
Vous pouvez toujours faire une analyse de vos données et devinez codepage, et bien que cela puisse en faire un peu moins fuglier, vous êtes devinant encore, et donc il sera toujours fugly :)
Etes-vous sûr que c'est juste un mauvais encodage ou que quelques glyphes manquent? – Gumbo
Assez sûr qu'il a été écrit dans un jeu de caractères non-UTF-8. Plusieurs fichiers montrent le même résultat pour les mêmes caractères douteux (e-acute, etc). – Oli