J'utilise Lucene (ou plus précisément Compass), pour enregistrer des discussions dans un forum et j'ai besoin d'un moyen d'extraire les mots clés derrière la discussion. Cela dit, je ne veux pas indexer toutes les entrées que quelqu'un fait, mais plutôt avoir une liste de «mots-clés» qui sont pertinents pour un certain contexte et si l'entrée correspond à un mot-clé et est au-dessus d'un seuil que j'ajouterais ces entrées à l'index. Je veux pouvoir utiliser la puissance d'un analyseur pour extraire les choses et faire sa magie, mais ensuite retourner les jetons de l'analyseur afin de faire correspondre les mots-clés, et aussi compter le nombre d'occurrences de certains mots être mentionné.Demander des jetons Lucene sans indexer
Existe-t-il un moyen d'obtenir les jetons à partir d'un analyseur sans avoir à subir le surdébit d'indexation de chaque entrée? Je pensais que je devrais maintenir un RAMDirectory pour contenir toutes les entrées, puis effectuer des recherches en utilisant ma liste de mots-clés, puis fusionner les documents pertinents au gestionnaire de persistance pour stocker réellement les entrées pertinentes.
quelqu'un sait quelle réponse est meilleure ci-dessous ... Je suis à la recherche dans un problème similaire – andy