J'ai un peu de mal à trouver le bon indice de temps pour mes données pandas.Obtenir un index de temps en python pour les pandas dataframe
import pandas as pd
from datetime import strptime
import numpy as np
stockdata = pd.read_csv("/home/stff/symbol_2012-02.csv", parse_dates =[[0,1,2]])
stockdata.columns = ['date_time','ticker','exch','salcond','vol','price','stopstockind','corrind','seqnum','source','trf','symroot','symsuffix']
Je pense que le problème est que les choses de temps vient dans les trois premières colonnes: année/mois/jour, heure/minute/seconde, milliseconde. De plus, la colonne heure/minute/seconde laisse tomber le premier zéro si c'est avant midi.
print(stockdata['date_time'][0])
20120201 41206 300
print(stockdata['date_time'][50000])
20120201 151117 770
Idéalement, je voudrais définir ma propre fonction qui pourrait être appelé par l'argument des convertisseurs dans la fonction read_csv.
Je suppose que le manque de zéros ne gâche pas% H – Taylor