Après the plotly directions, je voudrais tracer quelque chose de similaire au code suivant:distributions Traçage avec des longueurs inégales
import plotly.plotly as py
import plotly.figure_factory as ff
import numpy as np
# Add histogram data
x1 = np.random.randn(200) - 2
x2 = np.random.randn(200)
x3 = np.random.randn(200) + 2
x4 = np.random.randn(200) + 4
# Group data together
hist_data = [x1, x2, x3, x4]
group_labels = ['Group 1', 'Group 2', 'Group 3', 'Group 4']
# Create distplot with custom bin_size
fig = ff.create_distplot(hist_data, group_labels, bin_size = [.1, .25, .5, 1])
# Plot!
py.iplot(fig, filename = 'Distplot with Multiple Bin Sizes')
Cependant, j'ai un vrai jeu de données mondiale qui est inégale dans la taille de l'échantillon (ie nombre du groupe 1 est différent de compter dans le groupe 2, etc.). En outre, il s'agit d'un format de paire nom-valeur.
Voici quelques données fictives pour illustrer:
# Add histogram data
x1 = pd.DataFrame(np.random.randn(100))
x1['name'] = 'x1'
x2 = pd.DataFrame(np.random.randn(200) + 1)
x2['name'] = 'x2'
x3 = pd.DataFrame(np.random.randn(300) - 1)
x3['name'] = 'x3'
df = pd.concat([x1, x2, x3])
df = df.reset_index(drop = True)
df.columns = ['value', 'names']
df
Comme vous pouvez le voir, chaque nom (x1, x2, x3) a un compte différent, et aussi la colonne « nom » est ce que je voudrais utiliser comme couleur.
Est-ce que quelqu'un sait comment je peux tracer cela dans l'intrigue?
FYI dans R, c'est très simple, j'appellerais simplement ggplot, et dans aes(fill = names)
.
Toute aide serait appréciée, merci!
Nous vous remercions d'une solution élégante. –