J'utilise la bibliothèque posix c regex (regcomp/regexec) dans mon application de recherche. Mon application prend en charge différentes langues, y compris celles qui utilisent des caractères multi-octets. Je rencontre un problème lors de l'utilisation de métacaractère de limite de mot (\ b). Pour les chaînes octet, il fonctionne très bien, par exemple:Limite du mot Regex pour les chaînes multi-octets
« \ bpaper \ b » correspond à « papier »
Cependant, si les chaînes de regex et de requête sont multi-octets, il ne semble pas pour fonctionner correctement, par exemple:
"\ b 紙張 \ b" ne correspond pas à "紙張"
Est-ce que je manque quelque chose? Toute aide serait très appréciée.
Info demandée:
- Langage de programmation: C
- Regex Bibliothèque: GNU C (regex.h)
Merci.
Pourriez-vous nous dire quel langage de programmation/bibliothèque vous utilisez pour RegExp? –
@Ferdinand: information demandée ajoutée. –