Dans le modèle sac de mots, je sais que nous devrions supprimer les mots vides et la ponctuation avant l'entraînement. Mais dans le modèle RNN, si je veux faire une classification de texte, est-ce que je devrais également supprimer les mots de passe?Dois-je supprimer les mots vides lorsque je renvoie la phrase à RNN
0
A
Répondre
2
Cela dépend de ce que votre modèle classe. Si vous faites quelque chose dans lequel la classification est aidée par des mots d'arrêt - un certain niveau de compréhension syntaxique, par exemple - alors vous devez soit laisser dans les mots d'arrêt ou modifier votre liste d'arrêt, de sorte que vous ne perdiez pas cette information. Par exemple, découper tous les verbes de l'être (est, est, devrait être, ...) peut gâcher un NN qui dépend quelque peu de la structure de la phrase. Toutefois, si votre classification est basée sur un sujet (comme suggéré par votre référence sac-de-mots), puis traiter l'entrée de la même manière: supprimer ces mots d'arrêt agaçants avant qu'ils ne brûlent un temps d'entraînement précieux.