Comment puis-je convertir une chaîne, telle que Příliš žluťoučký kůň úpěl ďábelské ódy.
en Prilis zlutoucky kun upel dabelske ody.
? La chaîne source est en Unicode, donc en principe, il devrait être possible d'utiliser la normalisation/décomposition pour séparer le tréma.Comment puis-je supprimer les signes diacritiques (trémas) d'une chaîne?
Malheureusement, je n'ai vu aucune bibliothèque dans Pharo (peut-être Zinc caché quelque part?) Qui supporterait soit le décapage des trémas, soit la décomposition.
Performance est pas vraiment un problème, car je ne vais pas l'appliquer à des ensembles de données massives (je pourrais utilisez une table de traduction, mais c'est assez sujet à erreur). Mais ce que vous suggérez est d'écrire une bibliothèque UFFI pour 'libicu'? –
Oui, à peu près. Malheureusement, le plugin que nous avons écrit est pour la VM Squeak 4 et je ne suis pas sûr à quel point il est portable à la nouvelle VM. –