Je travaille sur un projet où de nombreux analystes créent des modèles statistiques en R. Ils me fournissent généralement les objets modèles (fichiers .Rdata) et les automatisent en les exécutant pour différents jeux de données.Sérialiser le fichier .RData à la base de données
Mon problème est:
Puis-je utiliser une base de données et enregistrer ces fichiers .rdata là? Des conseils sur ce faire? (Je stocke actuellement les fichiers .Rdata sur le disque et utilise une base de données pour stocker les informations de localisation)
Je reçois beaucoup de scripts R d'autres analystes qui ont effectué un pré-traitement des données avant de créer les modèles. Est-ce que quelqu'un a déjà utilisé le langage PMML pour rendre ce processus répétable sans intervention manuelle? PMML stocke les étapes de pré-traitement, les étapes de modélisation en tant que balises de marquage et répète la même chose sur un nouvel ensemble de données.
Nous vous remercions de vos suggestions et commentaires.
-Harsh
Même si les blobs ne sont pas supportés, vous pouvez sérialiser/désérialiser vers et à partir d'ascii (comme vous le faites même dans votre exemple), puis stocker la chaîne ascii. –
Je pensais l'avoir dit? est-ce que je l'ai mal dit? –
Notez que l'ascii sérialisé obj est 16k octets grand (longueur (obj)), la version binaire est 11k octets grand, mais si vous enregistrez ("tt", fichier = "tt.RData") vous obtenez quelque chose de seulement 5k gros. – Spacedman