2013-05-05 1 views
1

Je travaille sur un problème de minage de texte: extraire l'endroit du texte. L'endroit pourrait être soit seulement des états, ou plus spécifique tel que le nom d'un quartier à Chicago, ou même une adresse spécifique. Mais c'est seulement aux États-Unis.Extraction de l'emplacement à partir du texte

J'ai essayé l'API Yahoo Place maker, mais je ne peux pas créer la clé API (le site ne répond pas). Y at-il de toute façon à le faire, comme mineur rapide, ou écrire une regex complète?

+2

Regex ne fonctionnerait pas pour cela, jetez un coup d'oeil ici: http://stackoverflow.com/questions/9397485/regex-street-address-match –

Répondre

1

Envisagez Stanford Named Entity Recognizer (NER). Démo en ligne ici:

http://nlp.stanford.edu:8080/ner/process

Il est une bibliothèque java. La licence est GPL v2, bien que la licence de distribution dans une application autonome soit coûteuse.

+0

Est-il possible d'utiliser rapidminer à cette fin? –

+1

Il y a le plugin Information Extraction pour RapidMiner mais je l'ai essayé plusieurs fois et je ne le comprends pas vraiment. –

Questions connexes