Bonjour, j'ai un problème avec python. J'essaie d'expliquer mon problème avec un exemple.python - problèmes avec l'expression régulière et unicode
J'ai cette chaîne:
>>> string = 'ÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüýþÿÀÁÂÃ'
>>> print string
ÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüýþÿÀÁÂÃ
et je veux, par exemple, remplacer charachters différents de Ñ, à, ï avec ""
j'ai essayé:
>>> rePat = re.compile('[^ÑÃï]',re.UNICODE)
>>> print rePat.sub("",string)
�Ñ�����������������������������ï�������������������Ã
J'ai obtenu ce . Je pense que c'est parce que ce type de caractères en python est représenté par deux positions dans le vecteur: par exemple \ xc3 \ x91 = Ñ. Pour cela, quand je fais l'expression regolar, tous les \ xc3 ne sont pas substitués. Comment je peux faire ce type de sous ?????
Merci Franco