J'ai des données saisonnières sur la neige que je veux regrouper par année de neige (du 1er juillet 1954 au 30 juin 1955) plutôt que d'avoir un hiver split données sur deux ans (1 Janvier, 1954-1931 Décembre, 1954 et le 1er Janvier, 1955-1931 déc 1955.)Les Pandas définissent une année saisonnière du 1er juin au 30 juillet au lieu du 1er janvier au 31 décembre.
J'ai modifié le code de cette question:
Using pandas to select specific seasons from a dataframe whose values are over a defined threshold (merci Pad)
def get_season(row):
if row['date'].month <= 7:
return row['date'].year
else:
return row['date'].year + 1
df['Seasonal_Year'] = df.apply(get_season, axis=1)
Y a-t-il une meilleure façon de faire que j'ai fait?