2016-07-01 1 views
0

Je veux prendre un fichier CSV avec Températures en degrés Celsius et le convertir en Fahrenheit.conversion de Celsius en Fahrenheit dans le fichier CSV

tentative actuelle:

import pandas as pd 
df = pd.read_csv('/temperature_data.csv',) 

def f(x): 
    x = x * 1.8 + 32 
    return float(x) 

df['AirTemperature'] = df.apply(f, axis=1) 

Je suis en mesure de le faire avec succès si je suffit d'entrer un nombre entier dans la fonction, mais je continue à recevoir ce message d'erreur lorsque je tente d'utiliser le fichier csv:

can't multiply sequence by non-int of type 'float' 

J'ai essayé de convertir les valeurs en float mais je n'ai pas eu de chance.

Modifier: Le fichier CSV que j'utilise est multi-colonnes. Il a plus que simplement la température de l'air.

également ici est retraçage complet

`--------------------------------------------------------------------------- 
TypeError         Traceback (most recent call last) 
<ipython-input-4-a63269740c5c> in <module>() 
----> 1 df['AirTemperature'] = df.apply(f, axis=1) 

/Users/pvayn/anaconda/lib/python2.7/site-packages/pandas/core/frame.pyc in apply(self, func, axis, broadcast, raw, reduce, args, **kwds) 
    4040      if reduce is None: 
    4041       reduce = True 
-> 4042      return self._apply_standard(f, axis, reduce=reduce) 
    4043    else: 
    4044     return self._apply_broadcast(f, axis) 

/Users/pvayn/anaconda/lib/python2.7/site-packages/pandas/core/frame.pyc in _apply_standard(self, func, axis, ignore_failures, reduce) 
    4136    try: 
    4137     for i, v in enumerate(series_gen): 
-> 4138      results[i] = func(v) 
    4139      keys.append(v.name) 
    4140    except Exception as e: 

<ipython-input-3-895f5da25595> in f(x) 
     1 def f(x): 
----> 2  x = x*1.8 + 32 
     3  return float(x) 

/Users/pvayn/anaconda/lib/python2.7/site-packages/pandas/core/ops.pyc in wrapper(left, right, name, na_op) 
    647     lvalues = lvalues.values 
    648 
--> 649    return left._constructor(wrap_results(na_op(lvalues, rvalues)), 
    650          index=left.index, name=left.name, 
    651          dtype=dtype) 

/Users/pvayn/anaconda/lib/python2.7/site-packages/pandas/core/ops.pyc in na_op(x, y) 
    588     result = np.empty(len(x), dtype=x.dtype) 
    589     mask = notnull(x) 
--> 590     result[mask] = op(x[mask], y) 
    591    else: 
    592     raise TypeError("{typ} cannot perform the operation " 

TypeError: ("can't multiply sequence by non-int of type 'float'", u'occurred at index 0') 
+0

Le code que vous avez donné fonctionne pour moi, avec un fichier CSV à une colonne contenant à la fois des nombres flottants et des nombres entiers. Pouvons-nous voir le retraçage complet? –

+1

Semble assez clair que 'x' reçu par la fonction est un type de séquence, pas un int. Cela semble être mentionné dans la documentation: http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.apply.html Vous devrez peut-être modifier 'f' pour accommoder cela. –

+0

Avez-vous une recommandation pour savoir comment je pourrais aborder ce @DavidZemens? – pvayn

Répondre

1

Je n'ai pas utilisé Pandas avant, mais l'examen de la documentation, cela semble que cela devrait fonctionner:

df['Air Temperature'] = df['Air Temperature'].apply(f) 

'Air Temperature' est une série dans la trame de données, et le series object a également une méthode d'application.