2009-03-17 8 views
1

J'essaye de construire un système PNL pour une affectation, pour lequel je suis autorisé à utiliser des bibliothèques externes. J'utilise des arbres d'analyse pour décomposer les phrases en leurs parties constitutives en noms, verbes, etc.
Je cherche une bibliothèque ou un logiciel qui me permettrait d'identifier la forme lexicale d'un mot, et éventuellement de la traduire à une autre forme pour moi. Fondamentalement, j'ai besoin de quelque chose avec des fonctions comme isPlural, singularize, getInfinitive, etc.
J'ai considéré le paquet Linguistique Ruby et un simple Porter Stemmer (pour les infinitifs) mais ni l'un ni l'autre n'est très bon.
Cela ne semble pas être un problème très difficile, mais très fastidieux.
Est-ce que quelqu'un sait d'un bon paquet/bibliothèque/logiciel qui pourrait faire des choses comme ça?PNL: manipulations morphologiques

Répondre

1

Typiquement, afin de construire un arbre d'analyse d'une phrase, il faut d'abord déterminer les informations de la partie de la parole et du lemme des mots dans la phrase. Donc, vous devriez déjà avoir cette information.

Mais dans tous les cas, afin de cartographier wordforms à leur lemmes, et synthétiser wordforms de lemmes, jetez un oeil à morpha and morphg, ainsi que la version Java (ou front-end) morphg contenu dans le SimpleNLG package. Il existe des méthodes telles que getInfinitive, getPastParticiple, etc. Voir par ex. le API for the Verb class.

+0

merci de m'avoir dit abt morpha .. j'ai trouvé un paquet ubuntu pour cela .. et il peut faire des infinitives assez easili .. encore besoin de lire les docs pour comprendre comment le faire faire les autres choses .. –

Questions connexes