Est-il possible d'effectuer plusieurs GetHTMLElement
dans le même flux de données? Je suis en train de Scrapy quelques attributs effectuant tout d'abord l'GetHTMLElement
(attribut sélection) et après avoir effectué un processeur UpdateAttribute
getHTML plusieurs attributs dans Apache Nifi
(attrib: ${HTMLElement})
Cette première partie fonctionne bien, mais lorsque je tente d'effectuer une seconde GetHTMLElement
, il ne peut pas analyser quoi que ce soit de la flowContent ...
Je les ai effectué de 2 manières séparées et les a fusionné avec MergeContent
et le travail ... Mais maintenant je dois effectuer 2 « Obtient » dans différentes parties d'un flux (après une scission) et la fusion ne fonctionnera pas ...
Merci pour votre aide ... J'ai tryed de demander dans la communauté Hortonworks (https://community.hortonworks.com/questions/131614/multiple-gethtmlelement.html)
Merci beaucoup! Il serait intéressant d'implémenter CSS Selector pour chaque propriété que vous pouvez ajouter, obtenant de nombreux attributs du HTML avec un seul processeur (comme EvaluateJSONPath ou EvaluateXPath) –