Je veux obtenir le contenu analysé par nutch dans un fichier texte. J'ai utilisé les commads #readseg mais la sortie n'est pas fructueuse.Comment obtenir le contenu des pages crawlées et l'URL correspondante dans nutch?
Y a-t-il un plugin qui peut obtenir nutch pour explorer et stocker l'URL et le contenu dans un fichier texte.
Le plugin devrait fonctionner dans la version linux de nutch. – Rahul
Peut-être que [this] (http://stackoverflow.com/questions/5123757/how-to-get-the-html-content-from-nutch) question peut aider. – Mike