2017-01-20 2 views
0

J'ai une base de données avec 1560 échantillons (lignes) et quatre caractéristiques (colonnes) et une colonne avec la classe (TRUE/FALSE).R Caret utilisant la recette - Impossible de créer le modèle en utilisant la fonctionnalité de recette du paquet caret.

Malheureusement, la base de données est trop grande pour vous donner un échantillon reproductible. Toute aide générale serait appréciée cependant!

Quand je lance maintenant la fonction train caret(),

lr_original <- train(original_data$class, original_data[,1:4], method='glm',metric = 'Accuracy', trControl= trainControl(method='cv', savePredictions = TRUE)) 

Je reçois l'erreur Erreur dans le tableau (y): tentative de faire une table avec> = 2^31 éléments

J'ai déjà essayé différentes méthodes d'échantillonnage (LOOCV et aucune) ainsi que différentes méthodes de classification (knn et svm) - toujours la même erreur.

Est-ce que 1560 lignes sont trop pour la fonction de train? Y a-t-il un moyen de contourner cela?

Merci pour votre aide

Répondre

0

I intervertis x et y dans la fonction de train.

Avec

lr_original <- train(original_data[,1:4],original_data$class, method='glm',metric = 'Accuracy', trControl= trainControl(method='cv', savePredictions = TRUE)) 

il fonctionne :)