Nous avons rencontré beaucoup de difficultés avec les entités chatbot sur-généralisantes sur Api.ai, c'est-à-dire renvoyant des valeurs qui n'ont pas été spécifiées pour cette entité lors de l'utilisation de la fonction "Définir les synonymes" fonctionnalité sur les entités personnalisées, même lorsque le drapeau "Autoriser l'expansion automatisée" est désactivé.Sur-généralisation d'entités sur Api.ai
Notre exemple clé est une entité que nous utilisons pour confirmer un choix d'utilisateur appelé confirm_accept. Nous avons eu une entrée: "c'est ça", avec des synonymes: "c'est ça", "c'est ça", "c'est ça merci", "c'est merci", "c'est ça merci". Cette valeur d'entité était renvoyée de manière inattendue dans des expressions où un "it" vagabond apparaissait. En général, nous avons vu beaucoup de généralisation d'entité inappropriée qui semble indiquer qu'il y a une certaine forme de suppression de mot d'arrêt et de bourrage/lemmatisation en cours d'identification d'entité ... et qui ne peut pas être désactivée.
Cela renvoie des classifications d'entités médiocres, ce qui rend difficile la création d'entités pour lesquelles des valeurs très précises sont importantes, par ex. où un seul mot ou caractère peut faire une grande différence de sens. Notre principal cas d'utilisation implique beaucoup de traitement d'adresses, il est donc important de ne récupérer que les valeurs que nous avons spécifiées.
Types de généralisations excessives que nous avons vu les suivantes:
- identification inappropriée des Déterminants (a, un, la, ceci, cela, etc.) dans le cadre d'entités: comme dans « ce » retour « qui est tout »
- découlaient mots: comme dans parasite parle de « conduite », retour « drive » (une entité de type rue valide)
- tiges pluriel inappropriée: une mention parasite des « enfants » retour « enfant » ou un "va" errant retournant "veut" (qui dans notre cas "enfant" et "volonté" sont des entités de nom de rue, donc nous ne voulons pas "chi" ldren "ou" will "à retourner)
Cela rend difficile la création d'un chatbot de qualité de production en utilisant le service Api.ai.
Quelqu'un at-il eu plus de chance d'obtenir une réponse d'Api.ai ou de résoudre le problème de sur-généralisation?