J'ai un format séparé où je vais avoir ces données:colonne de Split en fonction de certain format de séparation
df = data.frame(id=c(1,2),name=c('A~B~C','A~B~D'),value=c('1~2~3','1~~2'))
id name value
1 A~B~C 1~2~3
2 A~B~D 1~~2
qui devrait avoir la sortie suivante où le nom de la colonne est le nom de la colonne d'origine suivi du texte dans la colonne nom:
id value_A value_B value_C value_D
1 1 2 3
2 1 2
je parviens à obtenir le fractionnement du nombre en utilisant pour les boucles imbriquées pour traiter ma ligne de données par ligne. Cela fonctionne sur de petites données d'échantillon mais une fois que les données deviennent énormes, le temps est un problème.
De même, il peut y avoir plus d'une colonne de valeur, mais toutes doivent correspondre à la même colonne de nom. sortie Exemple:
id value_A value_B value_C value1_A value1_B value1_C
1 1 2 3 1 2 3
2 1 2 3 1 2 3
Si disons que j'ai une value1 et value2 colonnes. Quels changements puis-je apporter au 'dcast' pour le rendre capable de jeter les valeurs? Je sais que je peux utiliser 'cSplit (df, c ('nom', 'valeur1', 'valeur2'), '~', 'long')' pour diviser les 3 colonnes. – kaexch