Répondre

2

Cela dépend de ce que votre modèle classe. Si vous faites quelque chose dans lequel la classification est aidée par des mots d'arrêt - un certain niveau de compréhension syntaxique, par exemple - alors vous devez soit laisser dans les mots d'arrêt ou modifier votre liste d'arrêt, de sorte que vous ne perdiez pas cette information. Par exemple, découper tous les verbes de l'être (est, est, devrait être, ...) peut gâcher un NN qui dépend quelque peu de la structure de la phrase. Toutefois, si votre classification est basée sur un sujet (comme suggéré par votre référence sac-de-mots), puis traiter l'entrée de la même manière: supprimer ces mots d'arrêt agaçants avant qu'ils ne brûlent un temps d'entraînement précieux.