Je ne suis pas un étudiant en programmation en langage naturel, mais je sais que ce n'est pas trivial strcmp (n1, n2).Comparaison des noms humains: façons d'aborder cette tâche
Voici ce que je l'ai appris à ce jour:
- comparant les noms de personnes ne peuvent pas être résolus 100%
- il existe des moyens pour atteindre certain degré de précision.
- la réponse sera spécifique à la locale, c'est OK.
Je ne cherche pas d'alternatives orthographiques! L'hypothèse est que l'orthographe de l'entrée est correcte.
Par exemple, tous les noms ci-dessous peuvent se référer à la même personne:
- Berry Tsakala
- Bernard Tsakala
- Berry J. Tsakala
- Tsakala, Berry
J'essaie de:
- build (ou copier) un algorithme qui notes la relation 2 noms d'entrée
- trouver une méthode d'indexation (pour les noms dans ma base de données, pour les tables de hachage, etc.)
note: Ma tâche n » t sur la recherche de noms dans le texte, mais pour comparer 2 noms. par exemple.
name_compare("James Brown", "Brown, James", "en-US") ---> 99.0%
tanimoto est parfaitement heureux de prendre des chaînes, pas besoin de les lister-ify – Jimmy
Oups! Jimmy vous avez raison, merci! –
Très intéressant! Merci. Cela me donne réellement un résultat numérique significatif. (J'essaie de compiler this one pour toutes nos plates-formes ... n'a pas pu trouver une implémentation binaire) –