2012-08-11 4 views

Répondre

0

Le moyen le plus simple consiste à extraire des données à partir des données HTML et des données extraites. Vous pouvez utiliser le HTMLStripCharFilterFactory pour supprimer le code HTML du flux d'entrée.

<analyzer> 
    <charFilter class="solr.HTMLStripCharFilterFactory"/> 
    <tokenizer class="solr.StandardTokenizerFactory"/> 
</analyzer>