Je veux extraire des URL à partir d'une page Web ce ne sont que des URL par eux-mêmes pas des hyperliens, etc., ils sont juste du texte. Quelques exemples seraient http://www.example.com
, http://example.com
, www.example.com
etc. Je suis extrêmement nouveau à regex donc j'ai copié et collé comme 20 expressions en ligne tout a échoué à travailler. Je ne sais pas si je le fais bien ou pas. Toute aide sera grandement appréciée.J'essaie de créer une expression qui va extraire les URL
Répondre
Vous n'échapperez probablement pas à votre .
s. Vous devez utiliser \.
pour chacun d'eux.
Jetez un coup d'œil à strfriend.com. Il a un exemple d'URL, et le représente graphiquement.
L'exemple suggère est:
^((ht|f)tp(s?)://|~/|/)?(\w+:\[email protected])?([a-zA-Z]{1}([\w-]+.)+(\w{2,5}))(:\d{1,5})?((/?\w+/)+|/?)(\w+.\w{3,4})?((\?\w+=\w+)?(&\w+=\w+)*)?
J'ai écrit un post sur l'utilisation Regex pour trouver des liens dans une page HTML (l'intention était d'utiliser JavaScript pour ouvrir les liens externes ou des liens vers des documents tels que PDF, etc. dans une fenêtre contextuelle).
Le regex final était: ^ (: [./] +?) (: Actifs | https: // ((www) intégraliste)?!?.?)?
Le plein le message est ici: http://www.integralist.co.uk/javascript/regular-expression-to-open-external-links-in-popup-window/
La solution ne sera pas parfaite mais pourrait vous aider à vous orienter dans la bonne direction.
Mark
- 1. Créer une boucle qui va éditer 60 noms de TextBox?
- 2. Expression régulière pour extraire
- 3. Comment créer une méthode qui accepte une expression lambda
- 4. Créer une page WordPress qui redirige vers une autre URL
- 5. Expression régulière sur une URL
- 6. Je veux créer une application wpf qui va supprimer les yeux rouges de l'image
- 7. Expression régulière pour extraire HREF
- 8. Puis-je utiliser une expression régulière pour extraire le domaine d'une URL?
- 9. expression régulière nécessaire pour réécrire les URL
- 10. créer un écouteur qui va écouter un serveur push externe
- 11. URL Expression régulière amicale
- 12. expression régulière pour extraire les symboles @name de Tweet
- 13. expression régulière pour extraire les chaînes de fichiers Smarty
- 14. Créer une URL depuis HtmlHelper
- 15. comment créer une aide qui va rendre une vue partielle avec un modèle?
- 16. Expression régulière pour extraire un numéro
- 17. Créer une nouvelle expression à partir d'une expression existante
- 18. Expression régulière pour extraire les mots commençant par @
- 19. Comment extraire une valeur particulière d'un fichier INI en utilisant une expression régulière?
- 20. Expression régulière pour extraire les en-têtes POP3
- 21. En Perl, comment extraire correctement les URL entre parenthèses?
- 22. Expression régulière pour exclure des caractères pour une URL valide
- 23. Extraire toutes les URL à l'intérieur d'une chaîne en Ruby
- 24. besoin d'aide pour créer une expression régulière
- 25. Expression régulière qui ignore les entités HTML
- 26. Comment extraire une chaîne à partir d'une url
- 27. Comment créer dynamiquement une expression Linq?
- 28. Comment créer une expression régulière en Python?
- 29. Comment créer une expression régulière pour une liste de domaines?
- 30. Trouver une expression régulière qui correspond à une chaîne?
ami Regex (http://www.regexbuddy.com/) et l'antisèche regex (http://www.addedbytes.com/cheat-sheets/regular-expressions-cheat-sheet/) sont vos amis ... –
quelle langue utilisez-vous pour tenter d'extraire les URL, et comment allez-vous à ce sujet? Un exemple de ce que les expressions régulières que vous utilisez et comment vous les exécutez aiderait. – Chris
je suis très nouveau à cela mais je pense que son .net que le logiciel fonctionne et ce que j'ai fait est le logiciel extrait le contenu entier que vous utilisez regex pour affiner votre sélection ... je veux extraire une url de site Web il y a parfois 10 d'entre eux dans la sélection parfois aucun 100 parfois je veux juste un n'a pas d'importance lequel ... le seul regex iam utilisant est ceux que je trouve en ligne je ne sais même pas si iam les implémenter à droite ... je ahev avec succès regex à Travaillez pour obtenir des email et des numéros de téléphone mais pouvez l'obtenir pour obtenir des URLs juste une url hors de la sélection. – kyle