Vous cherchez un Regex pour supprimer tout ce qui précède et y compris q = et après et y compris & ct former l'URL suivante.Regex pour le nettoyage de Google Alert URL
Répondre
>>> re.match(r'http://.*?q=([^&]*).*?', url).group(1)
'http://www.foo.com/bar-foo-bar-foo-bar-foo-bar-1-ea-from-foo.html'
Vous aurez aussi besoin probablement aussi de décoder l'URL dans le cas où il a échappé à une des entités telles que & ou 20%. Ceci est cependant lié à la langue.
En PHP
preg_match('/^http:\\/\\/.*?q=([^&]*)/', $url, $matches);
print($matches[1]);
la sortie attendue est http://www.my-sample-domain.com/buy-cheap-inner-traditions-addiction-free-naturally-1-ea-from-herbalremedies.html – user525314
oui, ce sont les mêmes questions comme hier, je ne me suis pas inscrit hier, et maintenant je ne peux pas le trouver ... – user525314
@marcog, merci pour votre réponse, je l'ai testé sur gskinner.com et http: //.*? q = ([^ &] *). *? renvoie http://www.google.com/url?sa=X & q = http: //www.discountproductshop.com/buy-cheap-inner-traditions-addiction-free-naturally-1-ea-from-herbalremedies .html – user525314
Marco, ne peut-il utiliser backnames (groupes nommés)?
Vous pouvez spécifier backnames pour les groupes dans le langue standard regex: http://www.regular-expressions.info/named.html
Cette section dit: Fonction
sous() de Python vous permet de référence un groupe nommé \ 1 ou \ g . Cela ne fonctionne pas en PHP. En PHP, pouvez utiliser l'interpolation de chaîne de caractères entre guillemets doubles avec le paramètre $ regs que vous avez passé à pcre_match(): $ regs ['nom'].
Alors ceci est original:
/^http:\/\/.?q=([^ &])/
Cela peut fonctionner:
/^ http : \/\ /.? q = (\ g: [^ &])/
Est-ce que cela a du sens?
Les groupes nommés sont pour référence dans le regex/remplacement. Cela ne va pas aider ici. Le problème auquel fait face l'OP est qu'il a besoin d'une regex qu'il peut passer à preg_match qui correspond à la partie qu'il veut et seulement cela. Ce dont il aurait besoin, c'est quelque chose à faire correspondre - mais pas à la partie^http: \/\ /.? Q =, si cela a du sens? – marcog
- 1. Nettoyage de mes URL ASP.NET
- 2. URL pour Regex extenionless
- 3. pour Regex url domaine
- 4. Aide de Regex - nettoyage des espaces - Java
- 5. URL Regex pour le framework PHP
- 6. Regex pour les URL propres
- 7. Nettoyage d'un SP SQL avec Regex
- 8. Massage avec BeatifulSoup ou nettoyage avec Regex
- 9. Regex pour obtenir l'ID d'article de url
- 10. Nettoyage des URL. URLRewrite OU Redirection?
- 11. URL validation regex
- 12. URL de remplacement regex
- 13. regex pour URL, y compris la chaîne de requête
- 14. Le nettoyage de PHP
- 15. RegEx pour URL dynamique des paramètres Objectifs
- 16. ASP.NET MVC - Regex pour une URL Slug
- 17. Regex flash url
- 18. url rewrite regex question
- 19. url regex questions
- 20. RegEx aide pour IIS URL Rewrite
- 21. Javascript Clean URL Regex
- 22. Regex pour la validation des URL
- 23. problème url regex
- 24. Twitter état URL regex
- 25. Regex Url conf Django
- 26. django url regex
- 27. URL REGEX d'expression régulière
- 28. Réécrire .htaccess url regex
- 29. Django URL regex question
- 30. UnregisterHotKey() est-il important pour le nettoyage?
pouvez-vous donner un exemple de la sortie que vous attendez – ant
Est-ce exactement la même question qui a été supprimée hier? – Piskvor