2009-05-06 11 views
1

Exige une regex pour analyser des mots longs d'une longueur de plus de 20 symboles pouvant potentiellement casser le motif. Prévoyez d'utiliser ­ pour séparer les parties de mots.Regex pour analyser des mots longs

+0

ma question stupide /([^ \ s] {20}) /, '\ 1 ­' –

Répondre

1
([a-zA-Z]){20,} 
+0

Attention: cela ne fonctionnera pas avec les jeux de caractères étendus ... –

+0

Bien sûr cela dépend de l'auteur intentions. Parfois \ w est meilleur, mais rappelez-vous que \ w inclut des chiffres. –

+0

C'est vrai - cela dépend vraiment des besoins de l'auteur. –

4

Essayez cette expression régulière:

\b\w{20,} 

Ou si la mise en œuvre que vous utilisez supporte Unicode character properties:

\b\p{L}{20,} 
+1

Ne devrait-il pas \ w (W minuscule) correspondre à un caractère "mot"? \ W correspond à tout caractère "non-mot". –

+0

Bien sûr, sgehrig, vous avez raison. Merci! – Gumbo

Questions connexes