2010-02-11 7 views
5

Est-ce que quelqu'un connaît une bibliothèque pour comparer les adresses en Java?Java Comparer les adresses

Quelque chose qui donnerait l'égalité sur les adresses, écrit de différentes manières.

Par exemple, il faut reconnaître que

"22 Acacia Avenue" and "22 acacia av." 

est la même adresse.

Bien sûr, cela peut dégénérer beaucoup, c'est pourquoi je demande.

Merci d'avance.

+2

Vous vous demandez comment analyser les adresses en texte libre sous une forme canonique. Après les avoir analysés, les assimiler est facile. – Yoni

+0

@Yoni, je jette un coup d'œil à la distance de Levenshtein pour tester chaque partie. Merci. – Tom

Répondre

0

La seule façon de comparer avec précision les adresses vraiment et est de veiller à ce que les deux sont normalisés et certifiés. Aux États-Unis, vous pouvez tirer parti du code à barres du point de livraison à 12 chiffres sur une adresse certifiée pouvant servir d'identifiant unique pour une adresse donnée. Au-delà, il n'y a pas grand-chose d'autre car les adresses ne sont pas auto-validées et peuvent être écrites d'innombrables façons différentes. Même regex complexe n'aide pas. Et ne me lancez pas sur la façon dont les gens épellent incorrectement les rues et les villes.

Je dois mentionner que je suis le fondateur de SmartyStreets. Nous avons un CASS-certified address verification service qui vous permet de nettoyer, standardiser, vérifier et confirmer chaque adresse, ce qui fait de la détection de doublons un jeu d'enfant. Nous offrons le traitement par lots pour obtenir un C ASS-certified list ou un contrôle "direct" individuel via un address verification web service API.

Questions connexes