2013-06-17 5 views
0

J'essaie de comprendre s'il est possible d'indexer un segment de HTML et d'associer un attribut en tant que métadonnées à ce contenu avec solr. Par exemple:Indexation HTML avec solr

<div class="TODO">Content that needs to be indexed</div> 
<div class="FIXME">Fix the broken</div> 

Le contenu des blocs div ci-dessus doit être indexé avec l'association au nom de classe du bloc div.

Répondre

0

Je ne pense pas que vous pouvez le faire. Solr possède un stripeur HTML qui supprime tout le codage HTML.

Vous devez cependant analyser les segments vous-même.

Vous pouvez facilement ajouter des métadonnées si vous créez un document solr par segment. Dans un document, vous n'avez que des champs avec lesquels travailler, en fonction de la classe de div, vous choisissez un champ auquel vous ajoutez le segment.

0

pour ajouter des données à solr doivent adapter le format pour formater solr.

vous pour transformer votre xml en solr. vous pouvez utiliser XSLT.

Votre résultat devrait être cette .:

<add> 
    <doc> 
    <field name="TODO">Content that needs to be indexed</field> 
    <field name="FIXME">Fix the broken</field> 
    </doc> 
</add> 

Here vous pouvez voir comment les données index dans solr xml.

review this guide of solr.

+0

Merci! C'est ce dont j'aurais besoin. – JavaJack