2017-03-16 1 views
1

Je suis en train de charger un fichier tabulé dans pandas avec python afin que je puisse effectuer différentes requêtes. Malheureusement, la mise en forme de fichier est Nto grand (il charge bien à Excel, mais je dois travailler avec elle programaticallyComment faire pour supprimer les espaces blancs dans les en-têtes avec Python et pandas

Quand je fais.?

>>> print(df.columns) 

Index([u'Domain Name              ', 
     u'Current Bid ', u'Join By Date (ET)', u'Join By Date (PT)', 
     u'Bidders ', u'Seller   ', u'TLD  ', u'Length', 
     u'Words                   ', 
     u'Word Count', 
     u'Categories                          ', 
     u'Hyphens ', u'Numbers ', u'Auction Type'], 
     dtype='object') 

Comment puis-je corriger le fichier si simple df.query('TLD) == "value"') fonctionnerait

obtenir un nouveau fichier tous les 5 jours, alors je dois le faire programatically

Remarque -. S'il vous plaît patienter, je suis nouveau pour les scripts Python et

Répondre

8

Cela devrait aider à nettoyer les noms de colonnes:

df.columns = [x.strip() for x in df.columns] 
+5

vous pouvez également utiliser une version plus compacte de ce 'df.columns.str.strip()'. – umutto