L'expression régulière affichée ci-dessous est utilisée pour récupérer les URL, y compris celles au format example.com
. Cependant, je veux seulement pour ramasser sur les URL qui ont un www.
ou http
, https
, etc. En d'autres termes, il devrait ramasser www.example.com
. Il ne devrait pas ramasser example.com
.Expression régulière pour l'URL
((((ht|f)tp(s?))\://)?((www.|[a-zA-Z])([a-zA-Z0-9\-]+\.)([a-zA-Z]{2,8}))(\:[0-9]+)*(/($|[a-zA-Z0-9\.\,\;\?\'\\\+&%\$#\=~_\-]+))*)
Alors, ça marche ou quoi? – danben
Etes-vous sûr de vouloir uniquement faire correspondre les domaines américains? D'autres pays ont un point supplémentaire dans la partie TLD: www.bbc.co.uk ou www.tmnet.com.my. – slebetman
Cette expression fonctionne déjà en ce qui concerne la collecte des URL, y compris les sous-domaines. Cela ne fonctionne pas dans le sens où je ne veux que récupérer les URL commençant par www. ou http: Philipp G a résolu ce problème afin que l'expression qu'il a mise à jour soit la meilleure pour moi. – Mike