Quel type de travail a été effectué pour déterminer si une chaîne spécifique se rapporte à un emplacement géographique? Par exemple:Identification d'emplacements géographiques dans le texte
'troy, ny'
'austin, texas'
'hotels in las vegas, nv'
Je suppose que ce que je suis une sorte d'attendre est une approche statistique qui donne un degré de confiance que les deux premiers sont des lieux. Le dernier nécessiterait probablement une heuristique qui saisit "% s,% s" et utilise ensuite la même technique. Je suis particulièrement à la recherche d'approches qui ne s'appuient pas trop sur la proposition «in», vu qu'il ne s'agit pas d'un indicateur de localisation tout à fait clair et sans ambiguïté. Est-ce que quelqu'un peut me diriger vers des approches, des documents ou des utilitaires existants? Merci!
que les cartes chaînes individuelles à des endroits, mais n'est pas utile pour trouver des endroits dans un texte arbitraire. – jpatokal