2010-02-18 5 views
2

Je souhaite utiliser la fonction de streaming à distance de SOLR pour extraire et indexer le contenu des fichiers.Diffusion à distance de plusieurs fichiers dans SOLR

Cela fonctionne très bien si je passe stream.file = xxx en tant que paramètre à la méthode http GET.

Cependant, j'ai beaucoup de ceux-ci, et je veux les regrouper (c'est-à-dire ne pas avoir à avoir un GET par fichier).

Existe-t-il un moyen de le faire dans SOLR?

par exemple. Je voudrais pouvoir poster quelques xml comme ceci:

<add> 
    <doc stream_file="filename"> 
    <field name="id">123</field> 
    </doc> 
    <doc>... 

Répondre

0

This has been recently asked (et répondu) dans la liste de diffusion solr utilisateur.

+0

Ce lien semble être mort maintenant. Trouvé deux liens pertinents: http://lucene.472066.n3.nabble.com/Extracting-and-indexing-content-from-multiple-binary-files-into-a-single-Solr-document-td1916693.html et http : //mail-archives.apache.org/mod_mbox/lucene-solr-user/201003.mbox/%[email protected]%3E – kolrie

0

Je trouve que plusieurs ADD sont rapides, tant que vous ne faites que COMMIT le lot et n'essayez pas de COMMIT après chaque ADD. Je suppose que la peine de performance ne vaut pas la peine d'écrire votre propre RequestHandler.

Questions connexes