J'essaye d'analyser certains html retournés (à partir de http://www.google.com/movies?near=37130) pour rechercher des films en cours de lecture. Le modèle que j'essaie de faire correspondre ressemble à:
<span dir=ltr>Clash of the Titans</span>
ruby regex, analyse html
Parmi lesquels il y en a plusieurs dans le code HTML retourné.
Je suis en train obtenir un tableau des titres de films avec la commande suivante:
titles = listings_html.split(/(<span dir=ltr>).*(<\/span>)/)
Mais je ne reçois pas les résultats que je me attends. Quelqu'un peut-il voir un problème avec mon approche ou regex?
S'il vous plaît voir http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 –
En outre, cette question pourrait être la question la moins bien formatée déjà! –
La chose est, quelqu'un salope toujours si je ne poste pas chaque petit commentaire dans le code. Donc j'essayais juste d'éviter ça. – danwoods