2014-05-08 3 views
0

J'ai essayé avec la question de base si la question commence par "qui/quoi/.." mais il y a beaucoup de phrases qui ne commencent pas par des mots interrogatifs mais exigent une réponse comme "hôtels à Singapour". J'ai résumé la logique selon laquelle les phrases qui ne fournissent pas certaines informations mais qui sont incomplètes dans ce sens pourraient ne tomber que dans la classe interrogative. Y a-t-il des références pour ce sujet?Comment déterminer si une phrase donnée demande une réponse ou fournit des informations?

+0

J'ai entendu parler de recherches sur le développement d'un «classificateur de questions». Peut-être y a-t-il des recherches sur un classificateur interrogatif/déclaratif. Si ce n'est pas le cas (ou si vous ne trouvez pas les termes de recherche corrects), vous pouvez toujours créer un classificateur en développant des fonctionnalités (une partie du discours semble pouvoir être utile ici) et développer un ensemble d'apprentissage pour votre application spécifique. Cela dépend aussi de la source du texte pour la phrase. Par exemple, avez-vous une ponctuation de fin de phrase, telle qu'un point d'interrogation? –

Répondre

0

Ceci est une tâche très difficile, mais il y a quelques étapes que vous pouvez suivre dans la bonne direction (l'une d'entre elles est déjà de vérifier les mots 'WH' au début). Cela dépend aussi fortement du domaine de vos «phrases» (requêtes de recherche, énoncés, etc.).

Une chose que vous pourriez essayer est de (1) faire une vérification approfondie des questions évidentes que vous avez déjà décrites. Cela inclurait de vérifier si le premier mot est soit un mot WH, soit un verbe auxiliaire ('is', 'should', 'will', 'could', 'can', etc.), car en anglais, souvent, les questions subissent inversion auxiliaire. (2) Si vous disposez de bibliothèques de traitement en langage naturel, utilisez la segmentation POS et recherchez les phrases composées uniquement d'une phrase nominale (NP). Ceux-ci, puisqu'ils ne contiennent aucune information de prédiction, sont généralement des questions concernant le syntagme nominal. Je ne suis pas sûr de ce que vous utilisez pour votre analyse, mais un grand analyseur de bloc POS est celui du module Pattern nlp pour python (http://www.clips.ua.ac.be/pages/pattern-en#parser). J'espère que cela t'aides.

Questions connexes