J'utilise Lucene.net pour indexer le contenu & documents etc. sur des sites Web. L'indice est très simple et a ce format:Indexation du contenu multilingue avec Lucene.net
LuceneId - unique id for Lucene (TypeId + ItemId) TypeId - the type of text (eg. page content, product, public doc etc..) ItemId - the web page id, document id etc.. Text - the text indexed Title - web page title, document name etc.. to display with the search results
J'ai ces options pour l'adapter au service de contenu multilingue:
- Créer un index séparé pour chaque langue. Par exemple. Lucene-enGB, Lucene-frFR etc.
- Conservez l'index un et ajoutez-y un champ 'langage' supplémentaire pour filtrer les résultats.
Quelle est la meilleure option - ou y en a-t-il une autre? Je n'ai pas utilisé plusieurs index avant donc je penche vers la seconde.