2016-10-14 2 views

Répondre

2

Jetez un coup d'oeil à la langue. appel méthode pour voir comment les différents processus sont appliqués en séquence. Il n'y a pas beaucoup - il est fondamentalement:

doc = nlp.tokenizer(text) 
nlp.tagger(doc) 
nlp.parser(doc) 
nlp.entity(doc) 

Si vous avez besoin d'une autre séquence, vous devez simplement écrire votre propre fonction de les enchaîner différemment.

Je ne suis pas sûr que ce que vous demandez est logique, cependant. Si vous appliquez le tagueur POS au texte lemmatisé, le modèle statistique ne fonctionnera probablement pas très bien. Les suffixes flexionnels sont des caractéristiques importantes.