2011-10-25 7 views
1

Existe-t-il un moyen ou une meilleure pratique d'ajouter plus d'un fichier (par exemple 2 pdfs et 1 doc) dans un document solr-index en utilisant le gestionnaire d'extraction? Le résultat lors de l'interrogation devrait ressembler en quelque sorte comme ceci:Ajout de plusieurs fichiers interrogeables à un document index Solr

<result name="response"> 
<str name="id">123</str> 

    <doc> 
    <arr name="attr_content"> 
    content of pdf-1 
    </arr> 
    </doc> 

    <doc> 
    <arr name="attr_content"> 
    content of pdf-2 
    </arr> 
    </doc> 

    <doc> 
    <arr name="attr_content"> 
    content of doc-1 
    </arr> 
    </doc> 

</result> 

Dans mon application java j'ajoute des fichiers à l'Solr Index comme ce qui ne fait qu'ajouter un seul fichier:

ContentStreamUpdateRequest up = new ContentStreamUpdateRequest("/update/extract"); 
up.addFile(new File("c:\\document1.pdf")); 
up.setParam("literal.id", solrId); 
up.setAction(AbstractUpdateRequest.ACTION.COMMIT, true, true); 
solr.request(up); 

Répondre

0

Il permet un seul fichier être attaché en pièce jointe.
Solr autorise l'indexation des fichiers zip (patch), qui permet d'indexer le contenu des fichiers.
Donc, vous pouvez empaqueter les fichiers dans un zip et le nourrir Solr, qui serait indexé comme un document unique.