J'essaie de combiner le score de lucene avec PageRank, j'ai essayé de modifier la DefaulySimilarity pour ajouter le PageRank que j'ai déjà (dans un tableau avec l'URL correspondante), mais le problème est que je ne sais pas comment obtenir le champ de document stocké l'URL du document. Le termeDoc ne peut renvoyer que docID. Ou j'ai une autre idée est de modifier le TopScoreDocCollector qui a une méthode nommée collect (int docid), également donné un docid mais je ne sais toujours pas comment obtenir le champ stocké. Quelqu'un at-il une idée sur la façon d'obtenir le champ stocké d'un document par un identifiant de document? Ou vous avez une idée sur la façon de combiner lucene avec PageRank? Merci beaucoup.comment obtenir le champ stocké d'un document par un identifiant de document dans lucene?
2
A
Répondre
2
Pour obtenir la valeur d'un champ stocké dans Lucene par l'ID interne Lucene, utilisez IndexReader.document (int n). Si vous avez vos propres UID indexés, vous devrez rechercher par ce terme, obtenir l'ID Lucene, puis appeler IndexReader.document (int n).
Essayez-vous de calculer le PageRank à la volée? Si vous êtes, cela me semble fou. Généralement, PageRank est un traitement par lots qui s'exécute et le score PageRank statique attribué à chaque document est ajouté en tant que boost pendant l'indexation.
Questions connexes
- 1. Lire un document dans Lucene
- 2. Nombre de visites par document dans Lucene
- 3. "booster" différentes instances du même champ dans un document lucene
- 4. Récupère un objet Date dans Lucene Document
- 5. Document Lucene stimulons
- 6. mahout lucene document clustering comment?
- 7. Comment puis-je obtenir un champ de document avec jqCouch?
- 8. Amélioration de document dans Hibernate Search/Lucene
- 9. Supprimer document en terme de Lucene
- 10. Dans une recherche Lucene/Lucene.net, comment compter le nombre de visites par document?
- 11. Comment supprimer/mettre à jour un document avec lucene?
- 12. Association d'un fichier binaire à un document Lucene
- 13. Champ complet de Lucene
- 14. Le document ouvre un document supplémentaire
- 15. comment mettre un document incorporé dans un document incorporé?
- 16. Score du document affectant l'ordre de tri des résultats, Lucene
- 17. document xml imbriqué dans le document Simplexml
- 18. Obtenir mot de Résultats de recherche (nombre d'occurences) par document Lucene
- 19. l'ajout d'un document à un index Lucene provoque un plantage
- 20. Solr: fieldNorm différent par document, sans augmentation de document
- 21. Générer le document 2003 document
- 22. Obtenir document PDF aperçu
- 23. Lire des données d'un document Excel stocké dans Sharepoint?
- 24. PHP - Obtenir le nombre de pages dans un document Word
- 25. Kentico: Comment rediriger basé sur le type de document champ
- 26. Comment trouver un champ vide sur l'image d'un document numérisé
- 27. Imprimer un document BLOB
- 28. Comment obtenir le nom de fichier par son identifiant unique?
- 29. Instances de ruban par document
- 30. Document par défaut dans IIS