Je dois faire une boucle (ce que je n'ai pas fait auparavant) et étant donné les observations (colonne 1), je dois déterminer (i) laquelle des combinaisons parmi les variables (s1- s5) sont significatifs (P < 0,05), (ii) ne garder que les combinaisons significatives entre les variables avec les p valeurs correspondantes. Je pensais que ce serait une bonne façon d'apprendre comment faire une boucle dans l'affaire R. Les données d'origine est grand et est similaire à celui-ci:Faire une boucle dans R
ob <- c(120,100,85,56,87)
s1 <- c("ab","aa","ab","aa","bb")
s2 <- c("aa","aa","ab","bb","bb")
s3 <- c("bb","ab","aa","ab","ab")
s4 <- c("aa","ab","bb","ab","aa")
s5 <- c("bb","ab","aa","ab","bb")
dset <- data.frame(ob,s1,s2,s3,s4,s5)
dset
ob s1 s2 s3 s4 s5
120 ab aa bb aa bb
100 aa aa ab ab ab
85 ab ab aa bb aa
56 aa bb ab ab ab
87 bb bb ab aa bb
Toute aide serait apprécié!
Baz
comment déterminez-vous la signification? Comment les colonnes s1 - s5 jouent-elles dans la signification? Il y a presque certainement une solution vectorisée qui n'aura pas besoin d'utiliser un for-loop ici, mais je peux me tromper là-dessus. – Chase
@Chase, le niveau de signification serait P <0,05 et s1-s5 sont des ensembles de cisailles qui auraient influencé la performance des bovins dans le troupeau. – baz
alors maintenant vous voulez exécuter une régression linéaire pour toutes les combinaisons de s1 à s5? Est-ce correct? – Chase