Je dois analyser l'activité des utilisateurs qui utilisent une application pendant une période donnée, les périodes sont des horodatages de début et de fin. J'ai essayé avec un graphique à barres, mais je ne sais pas comment inclure des heures dans l'intervalle. Ex: utilisateur uid = 2 utiliser l'application à [18, 19, 20, 21]Pandas: Comment analyser les données avec horodatage de début et de fin?
Mon dataframe est comme:
uid sex start end
1 0 2000-01-28 16:47:00 2000-01-28 17:47:00
2 1 2000-01-28 18:07:00 2000-01-28 21:47:00
3 1 2000-01-28 18:47:00 2000-01-28 20:17:00
4 0 2000-01-28 08:00:00 2000-01-28 10:00:00
5 1 2000-01-28 02:05:00 2000-01-28 02:30:00
6 0 2000-01-28 15:10:00 2000-01-28 18:04:00
7 0 2000-01-28 01:50:00 2000-01-28 03:00:00
df['hour_s'] = pd.to_datetime(df['start']).apply(lambda x: x.hour)
df['hour_e'] = pd.to_datetime(df['end']).apply(lambda x: x.hour)
uid sex start end hour_s hour_e
1 0 2000-01-28 16:47:00 2000-01-28 17:47:00 16 17
2 1 2000-01-28 18:07:00 2000-01-28 21:47:00 18 21
3 1 2000-01-28 18:47:00 2000-01-28 20:17:00 18 20
4 0 2000-01-28 08:00:00 2000-01-28 10:00:00 08 10
5 1 2000-01-28 02:05:00 2000-01-28 02:30:00 02 02
6 0 2000-01-28 15:10:00 2000-01-28 18:04:00 15 18
7 0 2000-01-28 01:50:00 2000-01-28 03:00:00 01 03
Je dois trouver nombre d'utilisateurs dans une heure specifc
[Ce blog] (http://www.clowersresearch.com/main/gantt-charts-in-matplotlib/) donne un exemple détaillé de ce que vous voulez, s'il vous plaît jeter un oeil –
Et encore mieux, [ici] (https : //stackoverflow.com/questions/43367690/how-to-get-gantt-p lot-using-matplotlib) –