2017-03-16 2 views
0

Je dois implémenter un classificateur de texte multi-classe. J'ai pensé utiliser word2vec, quelqu'un peut-il me conduire à de bons documents/ressources qui en parlent. j'aurais 4-5 classes et j'ai beaucoup de données. Je dois en marquer manuellement certains. Ce serait aussi génial si quelqu'un pouvait éclaircir la taille de l'entraînement. Je prévois d'utiliser word2vec pré-formé pour l'intégration de mots.Quelles sont les bonnes ressources pour la classification de texte multi-classe en utilisant word2vec suivi par SVM/ANN/Deep Networks?

Répondre

0

Vous pouvez utiliser MLP pour cette tâche, cochez Keras' example pour classer les documents Reuters. Vous pouvez ajouter un calque d'intégration au début du modèle et le charger avec des poids de modèle pré-échelonnés. Gardez à l'esprit qu'il existe une classification multi-classes qui génère une seule classe pour chaque entrée et qu'il existe une classification multi-étiquettes qui peut générer plusieurs classes pour chaque entrée (vous n'avez rien dit à propos de votre caractère de données juste pour que vous sachiez).