2012-08-13 5 views
0

J'ai remarqué que les plugins d'analyse comme tika extraient les liens sortants du contenu, mais l'objet WebPage passé dans la méthode getParse/2 a déjà 2 tableaux contenant des liens sortants et des liens entrants.Nutch 2 parse et outlinks

Quelle est la différence entre l'extraction dans getParse et after fetch.

Merci.

Répondre

0

L'objet Webpage est créé à partir des informations contenues dans la base de données nutch, dans mon cas hsql.

Les liaisons de champ Webpage (et quelques autres) sont remplies après le processus d'analyse (après que la méthode getParse est revenue).