Ce problème est difficile à résoudre la procédure, mais beaucoup de progrès ont été réalisés dans la région ces derniers temps.
La plupart des traitements en langage naturel commencent par une grammaire (qui peut être ou non contextuelle). C'est un ensemble de règles de construction qui spécifie comment les choses plus générales sont faites à partir de plus spécifiques.
exemple contexte grammaire libre:
Sentence ::= NounPhrase VerbPhrase
NounPhrase ::= ["The"] [Adjective] Noun
Adjective ::= "big" | "small" | "red" | "green"
Noun ::= "cat" | "man" | "house"
VerbPhrase ::= "fell over"
Ceci est évidemment trop simpliste, mais la tâche de faire une grammaire complète pour définir tous anglais est énorme, et la plupart des systèmes réels définissent seulement un sous-ensemble de celui-ci applicable à un domaine de problème. Une fois qu'une grammaire a été définie, (ou apprise en utilisant des algorithmes compliqués connus seulement de Google) une chaîne, appelée un "exemple" est analysée selon la grammaire. qui marque chaque mot avec les parties du discours. une grammaire très complexe n'aurait pas seulement les parties du discours que vous avez apprises à l'école, mais des catégories telles que «sites Web», «noms de personnes âgées» et «ingrédients».
Ces catégories peuvent être laborieusement intégrées dans la grammaire par les humains ou déduites à l'aide de choses telles que la modélisation analogique ou les machines vectorielles de support. Dans chacun, des choses comme «poulet», «football», «barbecue» et «cricket» seraient définis comme des points dans un très grand espace dimensionnel, avec des millions d'autres points, puis les algorithmes de regroupement, définiraient des groupes juste en fonction des positions de ces points les uns par rapport aux autres. alors on pourrait essayer d'inférer des noms pour les groupes du texte d'exemple.
link text Cette recherche Google répertorie plusieurs techniques utilisées dans la PNL, et vous pourriez apprendre beaucoup d'eux.
EDIT pour résoudre simplement ce problème, on peut explorer le Web pour les phrases de la forme « _ est un _ » pour construire une base de données de relations élément-catégorie. Ensuite, vous analyser une chaîne comme ci-dessus, et recherchez les mots qui sont des éléments connus dans la base de données
Pourquoi "nourriture" et non "VOLAILLE"? – Gareth
Pourriez-vous nous donner des informations sur les méthodes que vous avez essayées et qui ont réussi? – morfara