2010-06-27 6 views
15

Je construis une application NLP et j'utilise Stanford Parser pour la plupart de mon travail d'analyse, mais je voudrais commencer à utiliser Python. Jusqu'à présent, NLTK semble être le meilleur choix, mais je n'arrive pas à comprendre comment analyser les dépendances grammaticales. C'est à dire. c'est un exemple de l'analyseur de Stanford. Je veux être en mesure de produire ce dans NTLK en utilisant Python de la phrase originale « Je suis le passage à Python. »:NLTK dispose-t-il d'un outil d'analyse des dépendances?

nsubj(switching-3, I-1) 
aux(switching-3, am-2) 
prep_to(switching-3, Python-5) 

Quelqu'un peut-il me donner un coup d'épaule dans la bonne direction pour analyser les dépendances grammaticales?

+0

Vous pouvez rester avec Python et continuer à utiliser Stanford Parser si vous utilisez Jython. C'est ce que je fais. – prash

Répondre

13

NLTK inclut le support pour l'utilisation du MaltParser, voir nltk.parse.malt.MaltParser.

Le modèle anglais pour le MaltParser pré-entraîné qui est disponible here parse à la représentation de la dépendance de base Stanford. Cependant, vous devrez toujours appeler le code JavaNLP de Stanford pour convertir les dépendances de base en la représentation CCprocessed donnée ci-dessus dans votre exemple d'analyse.

+0

Donc, coller entièrement avec Python n'est pas possible? – sholsapp

+2

Si vous voulez ** CCprocessed **, non, ce n'est pas le cas. – dmcer

Questions connexes