Pour une solution générique, Text::Unidecode translittérer à peu près tout ce qui y est jeté en US-ASCII pur.
Donc, dans votre cas cela fonctionnerait:
perl -C -MText::Unidecode -n -i -e'print unidecode($_)' unicode_text.txt
Le C est là pour vous assurer que l'entrée est lu comme UTF8
Il convertit:
l'été est arrivé à peine après aôut
¿España es un paìs muy lindo?
some special chars: » « ® ¼ ¶ – – — Ṉ
Some greek letters: β ÷ Θ ¬ the α and ω (or is it Ω?)
hiragana? みせる です
Здравствуйте
السلام عليكم
dans ce :
l'ete est arrive a peine apres aout
?Espana es un pais muy lindo?
some special chars: >> << (r) 1/4 P - - -- N
Some greek letters: b/Th ! the a and o (or is it O?)
hiragana? miseru desu
Zdravstvuitie
lslm `lykm
Le dernier montre les limites du module, qui ne peut pas déduire les voyelles et obtenir l'as-salaamu `alaykum de l'arabe original. Il est encore assez bon, je pense
Oui, il serait intéressant de savoir pourquoi -p ne fonctionne pas. – stephenmm