2010-07-20 7 views
1

J'ai vraiment besoin de WordPress pour les "assainir" et les remplacer par S, s, T, t quand il crée des slugs post.Quelles sont les décompositions chr (int) .chr (int) de ces 4 lettres? Ş, ş, Ţ, ţ

Je sais que le code pour cela est dans wp-includes/formatting.php et c'est la fonction "remove_accents", mais je ne peux pas pour la vie de moi comprendre comment ces lettres se décomposent en chr (int) .chr (int), et je voudrais J'adore savoir, car j'aimerais que ces diacritiques soient inclus dans cette liste.

Répondre

1

En supposant que vous utilisez utf-8:

Ș -> \xc8\x98 -> 200,152 
ș -> \xc8\x99 -> 200,153 
Ț -> \xc8\x9a -> 200,154 
ț -> \xc8\x9b -> 200,155 
+0

Merci. Pourrais-tu me dire comment tu as fait ça? ;) – intlect

+0

J'ai ouvert un terminal python et j'ai collé un glyphe dans une chaîne. Puis fait écho à la chaîne pour voir ses valeurs hexadécimales. Alternativement, vous pouvez obtenir ceux qui regardent simplement le glyphe sur une table de caractère utf-8 comme à http://www.utf8-chartable.de/unicode-utf8-table.pl?start=512. Alors tout ce dont vous avez besoin est de convertir ces valeurs en base10 – fcurella

5

J'essaie de faire mon affaire de ne pas connaître ou prendre soin, et certainement pas garder une table dans mon propre code :)

echo iconv('utf-8','ascii//translit','Ș, ș, Ț, ț'); 
//Output: S, s, T, t 
+0

Merci. Je sais que c'est comme ça que c'est "censé être fait", mais cette décomposition m'avait dérangé depuis longtemps. De plus, pour une raison étrange, je pensais que WordPress avait une raison (c) pour garder une table là-bas, et que cela aiderait à faire accepter ce changement mineur comme ils le faisaient avant, mais Googler autour, j'ai trouvé le raison d'être un commentaire sur la page php.net car je ne sais pas quelle fonction, fournissant les lignes qui semblent être devenues la fonction remove_accents. – intlect

+2

Eh bien, peut-être historiquement, 'iconv' n'est pas disponible partout. Pour fournir un package qui devrait fonctionner à peu près partout, un grand nombre de CMS et de frameworks réimplémentent du code existant. Les plus intelligents font une détection des caractéristiques avant d'y recourir. – Wrikken