On m'a suggéré d'utiliser Field.Set OmitNorms (true); lors de la création des documents pour lucenesearch pour trier le résultat en fonction du nombre de hits, mais je ne suis pas clair de ce qu'il fait et c'est sûr. Le tri du résultat en fonction du nombre de résultats signifie que le document dans lequel le texte de recherche est trouvé le nombre maximal de fois doit apparaître en haut, suivi de ceux qui ont moins de correspondance pour le texte de recherche. Je sais que c'est idiot, mais je veux savoir avant de mettre en œuvre ce s'il vous plaît aider.Quelle est l'utilisation de Field.Set OmitNorms (true); dans lucene
Répondre
Check out this article for a good paragraph description de ce que fait omettre les normes en termes d'optimisation. Fondamentalement, son genre d'avoir un mini-index lucene pour les termes à l'intérieur d'un champ, donc c'est vraiment seulement utile pour les champs qui auraient beaucoup de texte à l'intérieur d'eux.
Par défaut, un champ est indexé avec norm
, un produit de l'amélioration du document, de l'amplification du champ et du facteur de normalisation du champ (voir Similarity scoring). Cela ajoute un octet à la consommation de stockage et de mémoire de chaque champ, ce qui peut être ignoré pour les champs ou les types de champs sélectionnés en utilisant omitNorms
.
Les augmentations sont spécifiées lors de l'indexation, tandis que lengthNorm
est calculée de sorte que si deux documents correspondent à un terme de requête f
fois, le document le plus long obtient un score inférieur. Par conséquent, si vous souhaitez que vos documents soient évalués en fonction du nombre exact de termes correspondants, plutôt que du nombre de termes en fonction de la longueur du document, utilisez omitNorms
(et bénéficiez gratuitement des avantages de la consommation de mémoire).
- 1. Quelle est l'efficacité de element.cloneNode (true) (deep clone)?
- 2. Quelle est la différence entre while (true) et loop?
- 3. Est-ce que Zend Lucene a besoin de Java Lucene?
- 4. Quelle est l'entrée de dépendance appropriée dans pom.xml pour utiliser l'analyseur Snowball avec Lucene 2.4.0?
- 5. PHP true & 'true' difference
- 6. Quelle est la meilleure approche de recherche?
- 7. Quelle est la meilleure façon de permettre à plusieurs processus de modifier une lucene?
- 8. Lucene QueryParser
- 9. Pourquoi @ ($ null) est $ false, mais @ ($ null, $ null) est $ true?
- 10. Quelle est la limite de l'appel simultané à un service sur TCP avec reliabalesession TRUE?
- 11. Query dans Lucene
- 12. Quelle est l'importance de IMetadataExchange dans WCF?
- 13. Recherche multi-champs dans Lucene
- 14. Obtenir l'ID Doc dans Lucene
- 15. Lucene syntaxe de requête
- 16. Lucene Optimisation de l'index
- 17. Performances de la charge utile dans Lucene
- 18. Champ complet de Lucene
- 19. Page`_IsValid est défini sur true si OnClientClick est défini
- 20. Modification d'un terme dans Lucene
- 21. Lire un document dans Lucene
- 22. JFrame.setDefaultLookAndFeelDecorated (true);
- 23. lucene, ou sql fulltext?
- 24. Problème de requête lucene
- 25. Lucene Version
- 26. Lucene BooleanQuery
- 27. performance Lucene
- 28. Comportement inattendu de setParseIntegerOnly (true)
- 29. Que signifie i: nil = "true"?
- 30. Quelle est la signification de cet attribut dans .NET
Le document a été déplacé mais peut être consulté dans l'archive Internet http://web.archive.org/web/20101111232408/http://www.lucidimagination.com/Community/Hear-from-the-experts/Articles/Scaling-Lucene-et-Solr –