2015-11-17 1 views
1

J'ai besoin de convertir un fichier à 8 bits (Cyrillique/8859-5), donc je faisConversion de UTF8 ISO 8859-5, obtenir ISO 8859-1 à la place

iconv --from-code=UTF-8 --to-code=ISO-8859-5 file.UTF8 -o file.ISO 

Il fonctionne et enfin quand je vérifie le codage je reçois

file -bi file.ISO 
text/plain; charset=iso-8859-1 

Pourquoi ISO-8859-1?

Répondre

2

La commande file ne fait que des suppositions lors d'un codage de fichiers. Il serait probablement difficile de déterminer ISO 8859-5 sur ISO 8859-1 sans regarder les mots dans une base de données de dictionnaire, car ils sont tous les deux des formats 8 bits similaires.

Tant que vous savez que le fichier est vraiment ISO 8859-5, c'est ce qui compte.

Note: Je viens d'apprendre que (confusément) ISO 8859-9 est aparently officieusement appelé « Latin-5 », donc j'ai supprimé les références à ce nom déroutant.