J'ai écrit un code qui envoie des requêtes à Google et renvoie les résultats. J'extrais les extraits (résumés) de ces résultats pour un traitement ultérieur. Cependant, parfois des mots non-anglais sont dans ces extraits que je ne les veux pas. par exemple:Suppression de mots non anglais d'une phrase en python
/\u02b0w\u025bn w\u025bn unstressed \u02b0w\u0259n w\u0259n/
Je ne veux que le mot "sans contrainte" dans cette phrase. Comment puis-je faire cela? merci
Ce bloc de texte n'a aucun sens. –
Voulez-vous des mots du dictionnaire anglais, ou seulement des mots avec seulement des caractères ASCII (même s'ils sont, disons, des noms propres comme un nom ou un lieu, ou des mots anglais mal orthographiés)? – detly
@Glenn: ce sont des mots au format Unicode – Hossein