C'est la première fois que j'utilise des pandas et un ordinateur portable iPython et que je n'arrive pas à trouver les termes de recherche corrects pour mon problème.Comment regrouper des données et tracer des graphiques en ligne
Je dispose d'un fichier .xls
pour les données de temps de compilation pour 3 build-serveurs situés sur 3 sites A
, B
et C
. Ces serveurs de compilation compilent plusieurs projets, donc je choisirai n'importe quel projet spécifique. Par conséquent, je dois tracer des données comme celui-ci (pour un projet spécifique - pas tous dans un seul graphique, pour faire simple):
X-axis = date
Y-axis = average build time on that date
3 lines for sites A, B and C
Ce que je l'ai fait jusqu'à présent:
import pandas as pd
import numpy as np
import matplotlib as plt
file= r'/home/abc/Downloads/request.xls'
df = pd.read_excel(file,parse_dates=['Date'])
build_times = df[['Date','site','project','Duration']]
build_group = build_times.groupby(['Date','site','project']).mean()
Je besoin d'aide sur ce qui suit:
comment je sélectionne seulement un succès builds s'il y a une colonne
status
avec 0 et 1.Comment tracer les lignes pour les sites
A
,B
etC
(pour un projet spécifique) avec les axes X et Y mentionnés ci-dessus.
EDIT
Après la réponse de @jezrael, je suis en mesure d'obtenir les données suivantes
2017-03-27 A project1 963.200000
B project2 4587.176471
C project2 1449.375000
C project1 1449.375000
.......
2017-03-28 A project1 93.200000
B project1 4787.176471
C project2 1339.375000
C project1 1749.375000
Pouvez-vous ajouter un peu échantillon de données? – jezrael