J'utilise le modèle Gensim Doc2Vec, en essayant de grouper des parties d'une conversation de support client. Mon objectif est de donner à l'équipe de support des suggestions de réponse automatique.Comment décomposer des données de conversation en paires de (Contexte, Réponse)
Figure 1: montre une conversation d'échantillons où la question de l'utilisateur est ANSWERED la ligne suivante de conversation, le rendant facile d'extraire les données:
pendant la conversation "bonjour" et « Nos bureaux sont situés à New York » devrait être suggéré
Figure 2: décrit une conversation où les questions et les réponses ne sont pas synchronisés
pendant la conversation "bonjour" et "Nos bureaux sont situés à New York" devrait être suggéré
Figure 3: décrit une conversation où le contexte de la réponse est construit au fil du temps, et à des fins de classification (je suppose) certaines des lignes sont redondantes.
pendant la conversation "voici un lien pour le compte d'essai gratuit" devrait être proposé
J'ai les données suivantes par ligne de conversation (simplifiée):
qui a écrit la ligne (utilisateur ou agent), le texte, l'horodatage
J'utilise t il code suivant pour former mon modèle:
from gensim.models import Doc2Vec
from gensim.models.doc2vec import TaggedLineDocument
import datetime
print('Creating documents',datetime.datetime.now().time())
context = TaggedLineDocument('./test_data/context.csv')
print('Building model',datetime.datetime.now().time())
model = Doc2Vec(context,size = 200, window = 10, min_count = 10, workers=4)
print('Training...',datetime.datetime.now().time())
for epoch in range(10):
print('Run number :',epoch)
model.train(context)
model.save('./test_data/model')
Q: Comment dois-je structurer mes données de formation et ce que heuristiques pourrait être appliquée afin d'extraire des données brutes?
Entraînez-vous sur ceux où vous êtes * seulement *? Puis prédire lequel des choix désynchronisés est préférable et l'ajouter à l'ensemble d'entraînement? –
Merci pour la réponse, malheureusement, je ne peux pas vraiment être sûr quelle partie du contexte a déclenché la réponse de l'agent. J'apprécierai n'importe quelle approche qui me déplacera vers l'avant –
Question bien construite mais c'est un peu général. Quelles techniques connaissez-vous et dans quels domaines vous sentiriez-vous à l'aise? Peut-être que cela peut aider à le réduire. – wheaties