En R, je veux faire un test statistique pour comparer les moyennes entre deux catégories, mais je ne sais pas comment organiser mes données pour le faire.Je veux lancer un test t, comment dois-je organiser mes données pour le faire?
exemple Mock
Mes données sont organisées comme:
structure(list(age = c(39, 45, 83, 68, 48, 52, 66, 50, 61, 67), gender =
structure(c(2L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 2L), .Label = c("female",
"male"), class = "factor")), .Names = c("age", "gender"), row.names = c(NA,
10L), class = "data.frame")
Ce que je veux faire est de comparer la moyenne de chaque sexe avec un test t Welch, répondant à la question « des femmes les âges sont significativement différents de l'âge des hommes? ".
En théorie, pour exécuter le test, je pense que mes données devraient être sous la forme:
male female
39 45
83 61
...
Je suis sûr qu'il est soit un moyen d'exécuter le test directement sur la table d'origine ou un moyen facile pour transformer mes données dans cette forme ...
Alors, comment dois-je procéder?
Avez-vous le même nombre de femmes et d'hommes dans votre cadre de données d'origine? – Masoud
Non. Et j'ai vraiment beaucoup de variables catégoriques que je veux comparer avec l'âge (pas nécessairement binaire comme le genre) – francoiskroll
Votre titre sur le regroupement de données et de poser des questions à ce sujet est trompeur. C'est un peu un [problème XY] (https://meta.stackexchange.com/questions/66377/what-is-the-xy-problem). Je suggère de se concentrer sur le test t et comment l'exécuter. – Masoud