Je me demandais simplement si nous pouvions atteindre certaines fonctionnalités de SGBDR dans Lucene.Utilisation de Lucene comme une base de données relationnelle
Exemple: 1) J'ai 10 000 documents de projet (fichiers pdf) qui doivent être indexés avec leur contenu pour les rendre disponibles pour la recherche. 2) Chaque document est lié à un projet unique. Le projet peut contenir des détails comme le nom du projet, le numéro, la date de début, la date de fin, l'emplacement, le type, etc.
Je dois rechercher dans le contenu des fichiers pdf pour un mot clé donné, mais en affichant les résultats je veux afficher les méta-données du projet comme indiqué au point (2).
Mon idée est d'associer un champ appelé projectId à chaque fichier pdf lors de l'indexation. Une fois que nous aurons cela, nous lancerons une nouvelle recherche pour obtenir les méta-données du projet.
De cette façon, nous pourrions éviter les données en double. En outre, si nous voulons mettre à jour les méta-données du projet, nous finirons par mettre à jour à un seul emplacement. Sinon, si nous stockons ces méta-données avec tous les index pdf, nous finaliserons la mise à jour de tous les documents, ce qui n'est pas ce que je recherche.
veuillez aviser.
Essayez-vous d'éviter la réplication pour réduire la quantité d'espace occupé par les données en double? Ou essayez-vous d'éviter la logistique de la synchronisation de deux systèmes? –