Quelqu'un peut-il me suggérer la meilleure façon d'obtenir Hits (pas d'occurrences) d'un mot par document Lucene? ..Obtenir mot de Résultats de recherche (nombre d'occurences) par document Lucene
Répondre
SpanTermQuery.getSpans donnera une énumération des documents et où les termes apparaissent. Les documents sont triés, de sorte que vous pouvez simplement compter le nombre de fois que chaque document apparaît, en ignorant les informations de position.
Lucene utilise un index basé sur un champ plutôt que sur un document. Afin d'obtenir compte à terme par document:
- itérer sur des documents en utilisant IndexReader.document() et isDeleted().
- Dans le document d, parcourez les champs en utilisant Document.getFields().
- Pour chaque champ f, obtenez des termes en utilisant getTermFreqVector().
- Passez en revue le terme vecteur et les fréquences de somme par termes.
- La somme des fréquences de termes par champ vous donnera le vecteur de fréquence de terme du document.
+1. Vous devrez peut-être considérer les transformations radicales et autres que le texte a subies. Par exemple, si vous avez recherché le mot «beauté» sur un champ en colonnes, le terme réel de l'index serait «beauti». –
- 1. Nombre de visites par document dans Lucene
- 2. Pertinence de Lucene résultats de recherche
- 3. Comment obtenir le nombre total de résultats potentiels Lucene
- 4. Dans une recherche Lucene/Lucene.net, comment compter le nombre de visites par document?
- 5. Trouver la position des résultats de recherche de Lucene
- 6. Pourquoi les résultats de mon document Lucene sont-ils vides?
- 7. Score du document affectant l'ordre de tri des résultats, Lucene
- 8. Tri des résultats de recherche tableau par nombre de correspondances?
- 9. Lucene recherche par valeurs numériques
- 10. Obtenir le mot stemed dans Lucene
- 11. Comment regrouper dans les résultats de recherche Lucene?
- 12. Lucene Problème de recherche
- 13. Comment faire pour trier les résultats de recherche dans lucene?
- 14. Classement des résultats de recherche digg avec Lucene/Solr?
- 15. comment obtenir le champ stocké d'un document par un identifiant de document dans lucene?
- 16. Retour uniquement Nombre de résultats de recherche Google via Python
- 17. Lucene/Solr Problème de recherche?
- 18. Lucene - mot d'échappement?
- 19. Est-ce que la fonction de recherche lucene fonctionne dans un document de grande taille?
- 20. Recueillir tous les résultats d'une recherche dans Lucene/Optimisation
- 21. Obtenir par programme les résultats de recherche Google
- 22. Lucene mot-clé notification
- 23. Obtenir le nombre de résultats de l'API Google
- 24. Comment obtenir le nombre de résultats trouvés pour un mot-clé dans google
- 25. mySQL - résultats par nombre de secondes
- 26. Lucene .Net Recherche avec TermVector
- 27. MySQL: Obtenir le nombre de résultats défini
- 28. Lucene Indexation et recherche
- 29. Amélioration de document dans Hibernate Search/Lucene
- 30. Supprimer document en terme de Lucene
lucene java, ou lucene .net? – skaffman