J'ai utilisé avec succès l'analyse CSS de ruby (1.8) et de nokogiri pour extraire les données de face avant des pages Web.Comment analyser le code source html avec ruby / nokogiri?
Cependant, j'ai maintenant besoin de retirer des données d'une série de pages où les données se trouvent dans les balises "meta" dans le code source de la page.
L'une des lignes dont j'ai besoin est le suivant:
<meta name="geo.position" content="35.667459;139.706256" />
J'ai essayé d'utiliser mis XPath n'ont pas été en mesure de faire les choses.
Toute aide concernant la syntaxe requise serait grandement appréciée.
Merci
Vous dites: « Je l'ai essayé d'utiliser mis XPath n'ont pas été en mesure d'obtenir ce droit. » ** Montrez-nous ce que vous avez essayé ** afin que nous puissions vous aider à le faire correctement. –
Thx Andy - différentes façons de dire '// meta [blah]' etc. Je ne pouvais pas obtenir la syntaxe correcte pour la retirer. Je voulais vraiment le faire avec le sélecteur css et maintenant je sais comment. – rollbahn