2017-02-23 3 views
1

Je forme un modèle bagFDA en utilisant la fonction train() dans le paquet r caret, et enregistrez la sortie du modèle sous forme de fichier .Rdata. le fichier d'entrée est d'environ 300k enregistrements avec 26 variables, mais la sortie .Rdata a une taille de 3G. Je lance simplement ce qui suit: modelout < - train (x, y, méthode = "bagFDA") enregistrer (fichier = "myout.Rdata", modelout) sous un système de fenêtre. question: (1) pourquoi myout.Rdata est si grand? (2) comment puis-je réduire la taille du fichier?taille énorme dans la sortie du modèle de la fonction de train dans le paquet r caret

Merci d'avance!

JT

Répondre

1

Dans le trainControl défini returnData = FALSE pour commencer, si vous n'êtes pas créer une copie supplémentaire des données dans le modèle. Ma compréhension est la avec bagFDA vous créez un certain nombre de bootstraps, qui créent essentiellement le même nombre de copies de vos données. abaissant le paramètre B, réglé par défaut à 50, devrait rétrécir ainsi En outre, consultez ce post:

Why is caret train taking up so much memory?