2017-06-04 4 views
-3

Je dois admettre que je suis assez nouveau pour R et la programmation en général.Diagrammes de dispersion de densité catégorisés en couleurs

Je cherche à créer un nuage de densité. J'ai environ 350 points de données et seulement 27 valeurs x, y uniques. Je voudrais qu'il prenne la forme de ce que smoothScatter fait avec la seule différence étant que je voudrais que les points de données prennent la couleur qui refléterait la densité absolue (comme, 1-5 vert; 2-10; bleu; 11-20 , rouge, etc.), pas à quel point la couleur est intense. Essentiellement, les points vives et colorées est ce que je suis après

C'est à quoi il ressemble avant la coloration:

enter image description here

Pouvez-vous s'il vous plaît me aider à comment faire?

+0

Ceci est un nuage de points, mais une parcelle de densité est autre chose. Demandez-vous que la couleur reflète le nombre de points de données dans chaque position? Si c'est le cas, nous aurons besoin de données pour fournir des conseils à ce sujet. –

+0

Salut Jonathan, en effet, je demande de la couleur pour refléter combien de points de données résident dans chaque position. Il y a une variable indépendante Grade et une variable dépendante corrigée. La variable d'improvisation est corrigée - Notation (Improv = Corrected - Grade). Vous voulez montrer quels grades originaux améliorent le plus lors de la correction. –

Répondre

0

Êtes-vous après quelque chose comme ça?

set.seed(357) 
xy <- data.frame(x = runif(37), y = runif(37)) 
xy <- round(xy, 1) 
rp <- sample(1:30, size = nrow(xy), replace = TRUE) 
xy <- xy[rp, ] 
xy$colors <- cut(rp, 3) 

library(ggplot2) 

ggplot(xy, aes(x = x, y = y, color = colors)) + 
    theme_bw() + 
    geom_point() 

enter image description here

ggplot(xy, aes(x = x, y = y, color = colors)) + 
    theme_bw() + 
    geom_point()+ 
    geom_density_2d(h = 0.25) 

enter image description here

+0

Désolé pour ma réponse lente, nécessaire pour passer par toutes les fonctions que vous avez mentionnées pour comprendre ce qui se passe :) J'ai peur que ce n'est pas ce que je rechercherais. Serait-il utile de joindre un fichier CSV? –

+0

@PiotrWojciechowski vous devez ajuster la fonction de coupe pour produire les bacs que vous recherchez ... –

1

Voici une autre façon en utilisant la fonction standard de terrain et mtcars où la couleur reflète le modèle de la voiture.

attach(mtcars) 
cars <- mtcars 
cars$model <- as.factor(rownames(cars)) 
plot(cars$mpg, cars$wt, col = cars$model, pch = 16) 

enter image description here

+0

Salut, merci pour cela :) Ce serait vraiment utile si je pouvais catégoriser manuellement les points de données concernant leur fréquence. Je préférerais que R compte le nombre de points de données existant à un certain endroit et ensuite le colorise en conséquence. –

+0

Il s'agit d'une analyse complètement différente connue sous le nom de clustering. Voici une référence: http://www.statmethods.net/advstats/cluster.html –

+0

Merci, maintenant je sais que je dois aller vers k-means. Je vais essayer de comprendre cela (un chimiste par l'éducation et maintenant en RH donc ça peut être difficile ...). Toutes les astuces appréciées! –