2013-04-13 3 views
4

Je veux extraire la clause subordonnée, la clause principale, la clause relative, la clause relative restrictive, la clause relative non restrictive des phrases mais je ne sais pas comment faire ce travail. par exemple:Extrait proposition de phrase de la clause

"Je l'ai vue pour la première fois à Paris, où j'ai vécu au début des années 90."
[clause principale] [clause relative]

"Elle a tendu la main blessée."
[clause principale] [clause restrictive relative]

aidez-moi s'il vous plaît à faire ce travail?

Répondre

3

Vous devriez être capable d'extraire cette information (avec une précision raisonnable) avec une analyse de circonscription. Il existe un certain nombre d'implémentations répertoriées here. Pour cette liste, j'ajouterais mon propre, disponible pour le téléchargement here. C'est plus rapide que n'importe quel autre analyseur de haute précision disponible, et documenté raisonnablement bien (pour le code de recherche).

+1

Merci pour votre réponse. J'ai lu le document de Stanford parser, mais je ne sais pas comment écrire un programme pour obtenir la clause principale, ... de la phrase. S'il vous plaît, donnez-moi un guide pour obtenir la clause principale, ... de la phrase en Java avec votre analyseur ou d'autres. – SahelSoft

+1

Dans le style d'annotation de Penn Treebank, les clauses sont généralement libellées "S". Le nœud "S" en haut de l'arbre serait généralement la clause principale, et tout nœud "S" contenu serait subsidiaire. Bien sûr, cela est confondu avec des fragments (FRAG), et d'autres labels associés (SBAR, SBARQ, etc.). Vous voudrez regarder par-dessus les directives d'annotation de Penn Treebank et créer votre propre heuristique pour quelles étiquettes vous considérez «principal» et «subsidiaire» pour votre application. – AaronD