Je crée un service qui pourrait être «international» sur les marchés non anglophones. Je ne veux pas restreindre un nom d'utilisateur à la plage de caractères ASCII, mais je voudrais autoriser un utilisateur à spécifier son nom d'utilisateur "naturel". OK, utilisez UNICODE (et dites UTF-8 comme encodage de mon nom d'utilisateur).Comment autoriser un sous-ensemble de points de code UNICODE dans la validation d'entrée?
Mais! Je ne veux pas que les utilisateurs créent des noms d'utilisateur "non-nom" qui contiennent des points de code "symbole". Par exemple, je ne veux pas autoriser un nom d'utilisateur comme √√√√√√øøøøø.
Existe-t-il une liste de points de code "symbolique" pour UNICODE que je peux vérifier (peut-être avec une regex) pour accepter/rejeter un nom d'utilisateur donné?
Merci!
Ah, je ne savais pas à ce sujet! C'est parfait. Merci. – z8000
Je suppose que pour mes besoins, je vais laisser codepoints dans aucune de ces catégories: [Ll] Lettre \t, Minuscules [Lm] \t Lettre, Modificateur [Lo] Lettre \t, Autres [Lt] \t Lettre, casse de titre [Lu] \t Lettre, majuscule – z8000
Eh bien, par exemple, Perl supporte une pseudo-catégorie pour l'expression régulière appelée * IsWord *, qui est définie comme: Ll + Lu + Lt + Lo + Nd –