2011-05-14 2 views

Répondre

5

Votre question est vraiment deux questions: comment utiliser GATE pour trouver des entités nommées et peut-être comment intégrer GATE dans votre application.

La reconnaissance ou la classification d'entités nommées est un vaste domaine de recherche et, selon les entités nommées que vous souhaitez trouver, différentes approches peuvent être plus efficaces. GATE fournit une liste de nomenclatures très simple et une approche basée sur des règles pour trouver certaines catégories d'entités nommées dans le texte anglais: ANNIE. Si les catégories trouvées par ANNIE sont celles qui vous intéressent, une façon de commencer pourrait être de comprendre et d'améliorer ce qui est déjà fourni par ANNIE. Le pipeline ANNIE crée des annotations pour Person, Organization etc. dans votre document et vous n'avez besoin d'utiliser ou d'écrire qu'un PR qui accède à ces annotations et fait ce dont vous avez besoin avec les fonctionnalités ou le texte de ces annotations. Regardez le manuel GATE http://gate.ac.uk/sale/tao/split.html il explique ANNIE et a également une documentation sur la façon d'intégrer GATE (comment utiliser GATE directement à partir de votre programme Java sans exécuter l'interface graphique).