Supposons que je souhaite générer une grande base de données à partir de zéro.Création de grandes trames de données
L'utilisation de la fonction data.frame est la façon dont je créerais généralement des trames de données. Cependant, df est comme ce qui suit sont extrêmement sujettes aux erreurs et inefficace.
Il existe donc une manière plus efficace de créer la trame de données suivante.
df <- data.frame(GOOGLE_CAMPAIGN=c(rep("Google - Medicare - US", 928), rep("MedicareBranded", 2983),
rep("Medigap", 805), rep("Medigap Branded", 1914),
rep("Medicare Typos", 1353), rep("Medigap Typos", 635),
rep("Phone - MedicareGeneral", 585),
rep("Phone - MedicareBranded", 2967),
rep("Phone-Medigap", 812),
rep("Auto Broad Match", 27),
rep("Auto Exact Match", 80),
rep("Auto Exact Match", 875)),
GOOGLE_AD_GROUP=c(rep("Medicare", 928), rep("MedicareBranded", 2983),
rep("Medigap", 805), rep("Medigap Branded", 1914),
rep("Medicare Typos", 1353), rep("Medigap Typos", 635),
rep("Phone ads 1-Medicare Terms",585),
rep("Ad Group #1", 2967), rep("Medigap-phone", 812),
rep("Auto Insurance", 27),
rep("Auto General", 80),
rep("Auto Brand", 875)))
Aïe, qui est un code 'mauvais'. Comment puis-je générer cette «grande» base de données de manière plus efficace?
Je suis une sorte de c Pourquoi avez-vous autant de données répétées dans les deux colonnes? Habituellement, lorsque j'ai répété des données dans une colonne, il est varié ou cyclé dans l'autre (pensez à compter en binaire). – Owen