J'essaie de visualiser un ensemble de données en utilisant ggpairs de la bibliothèque GGally dans R. Je veux avoir une diagonale avec des graphiques de densité de chaque variable séparés par une variable de regroupement. Je ne suis pas en mesure d'obtenir les bonnes parcelles en raison d'un problème d'échelle. Pour illustrer mon propos, je vais utiliser l'ensemble de données artificielle suivante:Echelle correcte des tracés de densité avec plusieurs groupes utilisant GGally dans R
group=as.numeric(cut(runif(100),c(0,1/2,1),c(1,2)))
x=rnorm(100,group,1)
x[group==1]=(x[group==1])^2
y=2*x+rnorm(100,0,0.1)
data=data.frame(group=as.factor(group),x=x,y=y)
En utilisant ggpairs, je reçois l'intrigue suivante
library(ggplot2)
library(GGally)
ggpairs(data,columns = 2:3,colour="group")
Maintenant, comparez la partie supérieure gauche du terrain diagramme de densité de la variable x obtenu en utilisant ggplot2 uni:
ggplot(data, aes(x = x, colour = group)) + geom_density()
Nous pouvons voir que l'échelle y des courbes rouges et bleues dans ggpairs (la première figure) ne sont pas les mêmes, ce qui peut conduire à des conclusions trompeuses. Comment puis-je corriger ceci dans ggpairs?
faites les parcelles individuelles vous-même et utilisez 'grille.arrange', peut-être, plutôt que de compter sur ggally? ou déposer un problème avec le mainteneur 'Barret Schloerke'? –
hrbrmstr