Je cherche à standardiser du texte unicode en python. Je me demande s'il existe un moyen facile d'obtenir la forme "dénormalisée" d'un caractère unicode combinant en python? par exemple. si j'ai la séquence u'o \ xaf '(c'est-à-dire latin small letter o
suivi de combining macron
), pour obtenir ō (latin small letter o with macron
). Il est facile d'aller dans l'autre sens:Python "dénormaliser" unicode combinant les caractères
o = unicodedata.lookup("LATIN SMALL LETTER O WITH MACRON")
o = unicodedata.normalize('NFD', o)
U + 00AF n'est pas un * combinant * Macron. C'est U + 0304. – kennytm
'\ xaf' n'est pas le macron de combinaison,' \ u0304' est. –
oups. Vous avez mélangé les chiffres quand j'ai écrit la question :) – Puzzled79