Je travaille actuellement sur une implémentation de recherche de texte intégral Lucene.NET. Pour la plupart, ça se passe plutôt bien, mais j'ai quelques problèmes concernant les acronymes dans les données ...Problème de recherche d'acronymes dans Lucene.NET
Comme exemple de ce qui se passe si j'avais "N.A.S.A." dans le domaine que j'ai indexé, je suis capable de faire correspondre avec n.a.s.a. ou nasa, mais n.a.s.a ne correspond pas, même si je mets une recherche floue (n.a.a ~). La première idée qui me vient à l'esprit est de supprimer tous les. Avant d'indexer/chercher, mais cela ressemble plus à une solution qu'à une solution et j'espérais obtenir une solution plus propre.
Quelqu'un peut-il suggérer des modifications ou un analyseur différent (en utilisant StandardAnalyzer actuellement) qui pourrait être plus approprié pour faire correspondre ce type de données?