2016-09-26 2 views
3

Les lemmes WordNet peuvent avoir des formes apparentées. Par exemple, le nom « beurre » (ce qui signifie la diffusion que vous mettez sur le pain) est réputée derivationally liée au verbe « beurre » (ce qui signifie l'acte de propagation du beurre sur du pain):Que sont les "formes dérivées" dans WordNet?

>>> from nltk.corpus import wordnet as wn 
>>> 
>>> wn.lemma('butter.n.01.butter') 
Lemma('butter.n.01.butter') 
>>> wn.lemma('butter.n.01.butter').synset().definition() 
u'an edible emulsion of fat globules made by churning milk or cream; for cooking and table use' 
>>> wn.lemma('butter.n.01.butter').derivationally_related_forms() 
[Lemma('butter.v.01.butter'), Lemma('buttery.s.02.buttery'), Lemma('butyraceous.a.01.butyraceous')] 
>>> wn.lemma('butter.n.01.butter').derivationally_related_forms()[0] 
Lemma('butter.v.01.butter') 
>>> wn.lemma('butter.n.01.butter').derivationally_related_forms()[0].synset().definition() 
u'spread butter on' 
>>> 
>>> wn.lemma('flood.n.01.flood').synset().definition() 
u'the rising of a body of water and its overflowing onto normally dry land' 
>>> wn.lemma('flood.n.01.flood').derivationally_related_forms() 
[Lemma('flood.v.04.flood'), Lemma('deluge.v.01.flood'), Lemma('flood.v.02.flood')] 
>>> wn.lemma('flood.n.01.flood').derivationally_related_forms()[0] 
Lemma('flood.v.04.flood') 
>>> wn.lemma('flood.n.01.flood').derivationally_related_forms()[0].synset().definition() 
u'become filled to overflowing' 
>>> 

Cependant, on ne sait pas très bien ce que le terme «lié en dérivation» signifie. Par exemple, je pourrais argumenter que "télévision" et "télescope" sont "liés par la dérivation", puisque les deux mots sont dérivés du grec "têle", signifiant "loin". Mais WordNet est en désaccord:

>>> wn.lemma('telescope.n.01.telescope').derivationally_related_forms() 
[Lemma('telescopic.s.01.telescopic'), Lemma('telescopic.s.02.telescopic')] 

Ce qui précisément est donc la définition de WordNet d'une « forme liée derivationally »? Est-ce documenté n'importe où?

+1

Si vous envisagez de faire quelque chose de sérieux avec WordNet, et/ou si vous vous souciez des décisions de conception, le grand livre jaune mérite d'être lu: https://mitpress.mit.edu/books/wordnet (Étonnamment, à un prix raisonnable !) Il est assez vieux (1998!), Mais donne une bonne base pour ensuite aller lire tous les articles des conférences Wordnet, et d'autres recherches, ainsi que comprendre les changements d'une version à l'autre. –

Répondre

5

De l'WordNet glossary:

formes derivationally liées: Termes dans différentes catégories syntaxiques qui ont la même forme de racine et sont sémantiquement liés.

Le verbe « beurre » a le même root form que le substantif « beurre », ils sont différentes catégories syntaxiques (verbe vs nom), et ils sont clairement sémantiquement liés. D'autre part, "télévision" et "télescope" n'ont pas la même racine (mais "télévise" aurait la même racine que "télévision", et "télescopique" a la même racine que " télescope"). De plus, ils ne sont pas liés sémantiquement, et ils sont tous les deux des noms.

+0

Doux, cela me donne une clarté quasi totale. La seule chose dont je ne suis pas sûr, c'est comment la "forme racine" est un mot défini ici, puisque ce n'est pas dans leur glossaire. Une vérification pour clarifier cela (ou simplement un lien vers une définition rigoureuse quelque part) rendrait cette réponse complètement compréhensible. –

+1

@MarkAmery Wikipedia est aussi proche que possible. Ceci étant la linguistique, pas les mathématiques, une définition à toute épreuve est probablement difficile à trouver. – Thomas