Supposons que nous ayons 2 questions dans un sondage, l'une concerne la probabilité qu'une personne recommande une entreprise (disons qu'il y a 2 entreprises pour plus de simplicité).R: Empiler des données de questions multiples de perforation
Alors, j'ai une data.frame avec 2 colonnes pour cette question:
df.recommend <- data.frame(rep(1:5,20),rep(1:5,20))
colnames(df.recommend) <- c("Company1","Company2")
Et, supposons que nous avons une autre question qui demande aux répondants de cocher une case à côté d'un attribut qu'ils croient « crises » avec l'entreprise.
Alors, j'ai une autre data.frame avec 4 colonnes pour cette question:
df.attribute <- data.frame(rep(0:1,50),rep(1:0,50),rep(0:1,50),rep(1:0,50))
colnames(df.attribute) <- c(
"Attribute1.Company1",
"Attribute2.Company1",
"Attribute1.Company2",
"Attribute2.Company2")
Maintenant, ce que je voudrais être en mesure de faire est étudier la façon dont les attributs 1 et 2 sont liés à l'échelle la possibilité de recommander une question, pour toutes les entreprises (société indépendante). Juste pour avoir une idée de l'inertie entre ces personnes qui sont très susceptibles de recommander et d'attribuer 1 par exemple.
Alors, je commence par lier les deux questions ensemble:
df <- cbind(df.recommend, df.attribute)
Mon problème est d'essayer de comprendre comment empiler ces données telles que les colonnes ressemblent à:
df.stacked <- data.frame(c(df$Company1,df$Company2),
c(df$Attribute1.Company1,df$Attribute1.Company2),
c(df$Attribute2.Company1,df$Attribute2.Company2))
colnames(df.stacked) <- c("Likelihood","Attribute1","Attribute2")
Cet exemple est simplifié dans une large mesure. Dans mon problème actuel, j'ai 34 entreprises et 24 attributs. Pourriez-vous imaginer un moyen de les empiler efficacement, sans avoir à taper toutes les instructions c()?
Remarque: Le modèle de colonne pour probabilités est Co1, Co2, Co3, Co4 ... et le modèle pour les attributs est At1.Co1, At2.Co1, At3.Co1 ... At1.Co34, At2.Co34 ...
est la structure de 'df.stacked' ce que vous pense que ça devrait être? Le 'str' de' df.stacked' renvoie "' data.frame: 2 obs de 300 variables' " – Chase
Mis à jour. Merci d'avoir attrapé cette Chase. –
Juste pour m'assurer que je suis sur la même page, les données finales.le cadre devrait avoir les dimensions de 34 * n lignes et 25 colonnes (1 colonne pour la variable Likelihood, et 24 pour chaque attribut? – Chase