2010-09-11 3 views
2

Disons que j'ai document indexé avec Apache Solr qui contient cette chaîne:Normaliser unicode

Skrams Kluft INFOR

Je veux être en mesure de trouver avec la recherche en utilisant ce mot-clé (notez le "u" - "ü"):

Kluft

Y a-t-il un moyen de faire cela?

Répondre

2

Utilisez le ASCIIFoldingFilterFactory pour les analyseurs d'index et de requête.

+1

Il est à noter qu'il existe également le [MappingCharFilterFactory] (http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#CharFilterFactories), qui est utilisé par certains clients Solr populaires. Je ne suis pas sûr si elle offre des avantages particuliers sur le 'ASCIIFoldingFilterFactory', qui est certainement plus complet. Nous avons parfois besoin de faire des mises à jour de notre fichier 'mapping-ISOLatin1Accent.txt' standard sur [Websolr] (http://websolr.com/) pour accommoder les clients qui utilisent' MappingCharFilterFactory'. –