2016-06-16 2 views

Répondre

1

size est le nombre de dimensions dans les vecteurs créés. Ainsi, size=100 signifie que chaque document (en fait, l'étiquette de document) reçoit un vecteur à 100 dimensions à partir de l'apprentissage.

Plus les dimensions ne sont pas toujours meilleures: elles signifient un entraînement plus lent et un modèle plus grand. De plus, si vous travaillez sur un petit jeu de données, trop de dimensions risquent d'être surcoupées, empêchant le modèle de représenter des modèles généralisables dans les données.