2010-08-27 6 views
1

Nous avons plusieurs champs de nutch personnalisés que le crawler ramasse et indexe. Le transfert à solr via solrindex (en utilisant le fichier de mapping) fonctionne très bien. Le journal montre que tout va bien, mais l'index dans l'environnement de Solr ne reflète pas cela. Toute aide sera très appréciée,solrindex façon de mapper schéma de nutch à solr

Merci, Ashok

Répondre

2

Ce que je voudrais faire est d'utiliser un outil comme tcpmon pour surveiller exactement ce que Nutch envoie à Solr. En examinant la charge utile xml, vous pouvez déterminer si Nutch envoie correctement ces champs personnalisés à Solr. Si Nutch les envoie correctement, il se passe quelque chose du côté de Solr. Au contraire, vérifiez à nouveau votre code Nutch.

+1

Merci pour la réponse rapide, Pascal. J'ai fait ce que vous avez suggéré et j'ai réalisé que seuls les champs de base et de plugin faisaient partie du NutchDocument entrant qui était en train d'être mappé. Je me rends compte que mon problème était que j'utilisais une autre installation de nutch qui n'avait pas les plugins qui ajoutaient les champs personnalisés à l'index nutch. Donc, je suis sûr avec l'installation originale «crawl», l'index solr aurait aussi les champs personnalisés supplémentaires. J'espère que cela aide quelqu'un. Merci encore. –

Questions connexes