J'ai un tube Yahoo qui prend le flux Atom d'un groupe Google, et je veux faire un traitement sur le texte intégral du message (exécution de diverses expressions régulières pour extraire des données). Je peux obtenir le texte d'un message dans le texte brut à partir de Google en utilisant une URL comme ceci:Récupérer du texte brut dans Yahoo Pipes
http://groups.google.com/group/(group_name)/msg/(message_id)?dmode=source&output=gplain
Cependant, je vais avoir du mal à obtenir à l'intérieur des tubes Yahoo comme une valeur de chaîne. Récupérer la page rejette les pages non HTML. YQL en utilisant la table html semble fonctionner, et enveloppe le texte brut à l'intérieur un élément p, dont le texte que je peux extraire comme ceci:
select * from html where url="..." and xpath="//p"
Toutefois, si le texte du message contient des balises html, YQL renvoie une sous-arborescence HTML au lieu de un string. Est-il possible de l'aplatir dans sa source HTML?
Pouvez-vous poster le lien vers le tuyau? – Victor