Ceci est ma première publication sur Stack Overflow, alors s'il vous plaît laissez savoir si je devrais être plus approfondie lorsque vous posez des questions à l'avenir.Requête de classification pour Virtual Assistant en Java?
Actuellement, je travaille sur une application Assistant virtuel pour Android en utilisant Java, et bien que ça se passe bien jusqu'à présent, je ne sais pas comment aborder la classification des entrées des utilisateurs. Jusqu'à présent, j'ai implémenté le Stanford NLP Parser dans le programme, de sorte que les étiquettes de mots, de phrases et de mots puissent être appliquées au texte brut. Cela m'a permis de faire reconnaître par le programme des questions directes et d'en extraire le sujet, simplement en cherchant l'occurrence de certaines étiquettes.
(ROOT
(SBARQ <--- Indicates that the sentence is a question
(WHNP (WP Who))
(SQ (VBD were)
(NP (DT the) (FW samurai))) <--- Subject of question
(. ?)))
Bien que cela ressemble à un pas en avant, j'espère avoir finalement l'assistant capable de classer différents types de questions (questions liées à la météo, l'heure/date des questions liées, etc.) tout en étant capable de reconnaître des questions qui ne sont pas aussi directs mais qui demandent la même information (par exemple, "pouvez-vous me parler des samouraïs?" par opposition à "qui étaient les samouraïs?"). Faire cela en utilisant simplement l'interpréteur PNL de Stanford et en cherchant certaines balises semble une tâche très difficile. Est-ce que quelqu'un a des conseils sur les approches alternatives que je pourrais prendre?
Merci!
Merci pour votre réponse! Si je devais appliquer des balises POS aux données d'entrée et d'entraînement de l'utilisateur, cela augmenterait-il potentiellement la précision globale du classificateur? – Exo445
Les étiquettes POS peuvent être utiles ou non, cela dépend entièrement de votre méthode. Essayez de les utiliser sur vos données et voyez si cela fonctionne! – polm23