Existe-t-il un moyen - autre qu'une boucle for - de générer de nouvelles variables dans une trame R, qui seront toutes les interactions bidirectionnelles possibles entre les variables existantes? -à-dire en supposant une trame de données avec trois variables numériques V1, V2, V3, je voudrais générer les nouvelles variables suivantes:Génération de variables d'interaction dans les données R
Inter.V1V2 (= V1 * V2)
Inter.V1V3 (= V1 * V3)
Inter.V2V3 (= V2 * V3)
Exemple avec boucle:
x <- read.table(textConnection('
V1 V2 V3 V4
1 9 25 18
2 5 20 10
3 4 30 12
4 4 34 16'
), header=TRUE)
dim.init <- dim(x)[2]
for (i in 1: (dim.init - 1)) {
for (j in (i + 1) : (dim.init)) {
x[dim(x)[2] + 1] <- x[i] * x[j]
names(x)[dim(x)[2]] <- paste("Inter.V",i,"V",j,sep="")
}
}
+1 N'a pas été informé de la fonction model.matrix. Très utile! – Shane
Excellent! Vous pouvez également vous débarrasser du non pertinent (dans notre cas) intercepter model.matrix (~ (V1 + V2 + V3 + V4)^2-1, x) –
droit vous êtes. ou pour le cas complètement général as.data.frame (model.matrix (~.^2-1, x)) –