J'utilise NLTK pour extraire les noms d'un texte-chaîne commençant par la commande suivante:marquage POS en allemand
tagged_text = nltk.pos_tag(nltk.Text(nltk.word_tokenize(some_string)))
Il fonctionne très bien en anglais. Y at-il un moyen facile de le faire fonctionner pour l'allemand aussi bien?
(je n'ai aucune expérience avec la programmation en langage naturel, mais je réussi à utiliser la bibliothèque NLTK python qui est grand à ce jour.)
Un avantage que vous pourriez exploiter est que tous les noms sont activés en allemand. –
Balise 'german' enlevée dans le cadre du [** 2012 nettoyage **] (http://meta.stackexchange.com/questions/128315/the-great-stack-overflow-tag-question-cleanup-of-2012). –