Y at-il un moyen de trouver le dernier document Lucene qui a été entré dans un index Lucene? Par exemple. Est-ce que Lucene garde une trace de l'histoire d'une façon ou d'une autre ou puis-je extraire l'ordre des fichiers (Document) qui ont été ajoutés à un index? Contexte: Je veux créer un index très volumineux avec des millions de documents qui prennent quelques jours à s'exécuter. Je voudrais avoir une implémentation d'index qui détecte le dernier fichier qui a été ajouté et continue à cette position lorsqu'il est redémarré.Lucene Index Historique/Dernier fichier indexé
Répondre
Pas vraiment, non. Le plus proche que vous obtiendriez serait d'obtenir le plus haut ID doc de l'index. Si vous commencez simplement à ajouter des documents à un index vide, et que rien ne sera supprimé ou mis à jour ou autre, cela pourrait même fonctionner. Cependant, il n'y a aucune garantie que les ID de document soient attribués dans l'ordre.
Si vous avez besoin de connaître l'ordre dans lequel les documents sont ajoutés. vous devriez ajouter un champ qui gère cela. Une date ou une heure stockée dans l'index, ou un identifiant séquentiel serait bien utile. Bien que cela puisse sembler un peu exagéré, il vous suffit de stocker un identifiant pour identifier le document source à partir duquel vous souhaitez revenir. Dans ce cas, stockez ce seul ID où jamais. Dans lucene, dans une base de données, dans un fichier txt, une chaîne sérialisée. Tout ce qui vous rend heureux.
- 1. Archivage des index lucene
- 2. Index de fusion dans Lucene
- 3. Lucene index quel niveau?
- 4. Zend Lucene Index Merge
- 5. index Lucene octet []
- 6. Comment index-tank peut-il être indexé?
- 7. Bonnes pratiques fermeture index Lucene
- 8. index Lucene sur plusieurs tables
- 9. index de Lucene caractères spéciaux
- 10. neo4j lent lucene index requête
- 11. lire Lucene index sans serveur
- 12. comment rechercher champ non indexé dans apache lucene recherche
- 13. Stockez le fichier index Lucene à l'emplacement distant
- 14. Problème avec le fichier XML indexé
- 15. Zend Lucene & Symfony: un grand index vs plusieurs index multiples
- 16. Htaccess html fichier d'être indexé
- 17. Comment convertir un index Lucene à plusieurs fichiers en un seul index de fichier composé?
- 18. Recherche d'un terme spécifique dans un index Lucene
- 19. index SOLR/Lucene retourner des résultats uniques
- 20. Lucene créer des index en double
- 21. Utiliser Lucene comme un index inversé
- 22. Lucene - comparaison des données dans plusieurs index
- 23. Luke-Lucene Index Outil de recherche
- 24. Mise à jour des index Sitecore Lucene
- 25. Récupère le contenu d'un fichier indexé à partir d'un catalogue Index Server?
- 26. Solr Sunspot champ non indexé
- 27. Comment gérer les index lucene dans l'application cloud azure
- 28. Index fichiers RTF dans Lucene avec champs intacts
- 29. Index Lucene supprimé lors de l'ouverture avec Luke/Indexreader
- 30. Unique vs indexé
Cela a du sens, j'ai stocké le dernier identifiant qui a été indexé de ma collection et cela semble fonctionner. Je stocke chaque identifiant pour ne pas avoir à me demander lequel pourrait être double et la performance d'exécution est plutôt bonne ... – RalfB