Que mon exemple soit beaucoup grand, mon code est ici:Comment obtenir la dernière date dans un intervalle personnalisé? - Pandas
import pandas as pd
import numpy as np
import io
t = """
name date
a 2005-08-31
a 2005-09-20
a 2005-11-12
a 2005-12-31
a 2006-03-31
a 2006-06-25
a 2006-07-23
a 2006-09-28
a 2006-12-21
a 2006-12-27
a 2007-07-23
a 2007-09-21
a 2007-03-15
a 2008-04-12
a 2008-06-21
a 2008-06-11
b 2005-08-31
b 2005-09-23
b 2005-11-12
b 2005-12-31
b 2006-03-31
b 2006-06-25
b 2006-07-23
b 2006-09-28
b 2006-12-21
b 2006-12-27
b 2007-07-23
b 2007-09-21
b 2007-03-15
b 2008-04-12
b 2008-06-21
b 2008-06-11
"""
data=pd.read_csv(io.StringIO(t),delimiter=' ')#5 space here
data
Ce que je veux faire est de trouver le tout dernier jour de l'année quelle année commence 2005-7-1
) et à la fin 2006-06-30
, commencer 2006-7-1
et fin 2007-6-30
... et ainsi de suite. Et mon résultat attendu est ici:
name date
a 2006-06-25 #the last day of the 2005/7/01 -2006/06/31
a 2007-03-15 #the last day of the 2006/7/01 -2007/06/31
a 2008-06-21 #the last day of the 2007/7/01 -2008/06/31
b 2006-06-25 #the last day of the 2005/7/01 -2006/06/31
b 2007-03-15 #the last day of the 2006/7/01 -2007/06/31
b 2008-06-21 #the last day of the 2007/7/01 -2008/06/31
Comment résoudre ce problème? Je pense que je devrais utiliser le custom
est-ce est long à lire? – ileadall42
Note: Septembre a seulement 30 jours, donc il y a quelques mauvaises données là-dedans. –
@AndyHayden Mon dieu, merci de le signaler! – ileadall42