Je passais par toutes les questions existantes mais je ne pouvais pas obtenir quelque chose de très pertinent.Lucene Fuzzy Recherche de noms de clients et adresse partielle
J'ai fichier avec des millions de dossiers pour la personne prénom, nom, adresse1, adresse2, code de pays, date de naissance - Je voudrais vérifier ma liste de clients avec le fichier ci-dessus sur une base quotidienne se mettre à jour quotidiennement et le fichier est également mis à jour quotidiennement). Pour le prénom et le nom, je voudrais correspondre fuzzy (peut être lucene fuzzyquery/levenshtein distance 90% match) et pour les champs restants pays et date de naissance, je voulais exacte correspondance. Je suis nouveau à Lucene, mais en regardant le nombre de messages, semble être possible.
Mes questions sont les suivantes:
- Comment dois-je indexer mon fichier d'entrée? J'ai besoin de construire l'index sur la combinaison de FN, LN, pays, DOB et utiliser l'index pour la recherche
- Comment puis-je utiliser la requête Fuzzy de Lucene ici?
Existe-t-il un autre moyen de mettre en œuvre la même chose?
Merci Yuval, oui j'ai ID unique par personne dans le fichier , donc je devrais être bon. liste des clients est beaucoup plus petit que le fichier de la personne. Je vais essayer de résoudre ce problème et revenir. – Rushik