J'ai une chaîne de texte qui contient html, et j'ai besoin d'extraire chaque URL (probablement dans img ou une balise) pour créer une liste générique d'objets chaîne. Je veux seulement les URL de l'intérieur des balises html, pas dans le texte. Existe-t-il un moyen facile de le faire ou devrais-je recourir à des expressions régulières?extrait toutes les URL d'une chaîne
Si je dois recourir à des expressions régulières, cela vous dérangerait-il de m'aider aussi? :)
MISE À JOUR: Pour répondre à Seph, l'entrée sera standard html.
<p>This is some html text. my favourite website is <a href="http://www.google.com">google</a> and my favourite help site is <a href="http://www.stackoverflow.com">stackoverflow</a> and i check my email at <a href="http://www.gmail.com">gmail</a>. the url to my site is http://www.mysite.com. <img src="http://www.someserver.com/someimage.jpg" alt=""/></p>
Je veux
- http://www.google.com
- http://www.stackoverflow.com
- http://www.gmail.com
- http://www.someserver.com/someimage.jpg
le résultat final devrait être dans tous les urls tout html étiquette, ignorant ceux-ci sont sont « texte brut »
UPPERDATE Bien qu'il ait supprimé sa réponse, je tiens à remercier Jerry Bullard d'avoir attiré mon attention Regex amis (http://www.regexbuddy). Je voulais mettre en doute votre réponse, mais il est parti. Ramenez-le et vous aurez un vote!
Un texte serait utile, avec la sortie exacte désirée. – Seph
merci, voir ci-dessus –
@ codemonkey12: voir ma mise à jour basée sur votre commentaire RegexBuddy. –