Je veux sous-ensembles 100 fois une trame de données qui se compose de 20 variables (continues et catégoriques) en deux parties qui représentent 70% et 30%. Mais je peux le faire avec le jeu de données iris aussi à titre d'exemple.sous-ensemble plusieurs fois une trame de données
data(iris)
test.rows <- sample(1:nrow(iris), 105)
iris.70 <- iris[test.rows, ]
iris.30 <- iris[-test.rows, ]
Cela donne les trames de données que je veux. Mais comment puis-je faire cela 100 fois et stocker les résultats quelque part pour les employer plus tard?
J'ai essayé
output <- list()
for(i in 1:surveyed100){
output[[i]] <- test.rows <- sample(1:nrow(surveyed100), 246)
}
Mais il me dit: expression numérique a 5 éléments: seul le premier utilisé.
J'apprécierai votre aide.
Merci Leo cela semble très pratique. Est-ce que je peux utiliser ces données pour exécuter un modèle? Je veux en fait obtenir la valeur AUC –
Hey Diego, vous pouvez utiliser les dataframes dans la liste tout comme vous utilisez des dataframes normales, il vous suffit de les appeler depuis la liste. Dans un modèle, vous le feriez probablement comme ceci: 'lm (x ~ y, data = output [[1]] [[1]])' Vous pouvez même nommer les deux dataframes comme @docendodiscimus dans leur réponse et puis appelez-les avec 'output [[1]] $ train' ou quelque chose de similaire. – LAP