J'essaie d'obtenir une valeur de corrélation pour les entrées d'une semaine avant la sortie de la semaine suivante. Par souci de cet exemple, je l'ai configuré où chaque entrée de la semaine sera la sortie de la semaine suivante, et df.corr()
devrait donner un résultat 1.000000
.Comment Pandas Corrélation de Pearson Offset avec Datetime Index
Mes données d'origine ressemble à ceci:
Date Input Output
1/1/2010 73 73
1/7/2010 2 73
1/13/2010 3 2
1/19/2010 4 3
données échantillon complet téléchargé ici: https://drive.google.com/open?id=0B4xdnV0LFZI1MzRUOUJkcUY4ajQ
Voici mon code à ce jour:
import pandas as pd
df = pd.read_csv('pearson.csv')
df['Date'] = pd.to_datetime(df['Date'], errors = 'coerce')
df = df.set_index(pd.DatetimeIndex(df['Date']))
df = df[['Input', 'Output']]
x = df.corr(method = 'pearson', min_periods=1)
print(x)
Et comme un débutant est là où je suis coincé. Je ne vois pas une option shift
intégrée dans la fonction et je ne sais pas comment faire cela.
Toute aide est appréciée.
Merci, moi
BTW c'est tous les 6 jours. – piRSquared