2016-06-16 1 views
1

Je suis très nouveau pour Python et les pandas en particulier. J'ai un problème de réorganisation irrégulière où je veux concaténer toutes les chaînes d'une colonne de l'image où une variable d'id correspond à l'autre colonne. Il s'agit d'un problème de réorganisation irrégulière, car le nombre de concaténations à effectuer peut varier en fonction du id.reshape python concaténer texte irrégulier dataframe

Ainsi, par exemple:

import pandas as pd 
import numpy as np 
df = pd.read_csv('sample.txt') 
print df 

    id text 
0 1 ABC 
1 1 BCD 
2 2 CDE 
3 2 DEF 
4 2 EFG 
5 3 FGH 

Je voudrais utiliser id pour remodeler et concaténer tous text pour les cas où id matches, entraînant quelque chose comme ceci: impression (df_new):

id   text 
0 1  ABC BCD 
1 2 CDE DEF EFG 
2 3   FGH 

Répondre

4

utilisation groupby avec l'agrégation join:

print (df.groupby('id')['text'].apply(' '.join).reset_index()) 
    id   text 
0 1  ABC BCD 
1 2 CDE DEF EFG 
2 3   FGH 
+0

EKL Si vous pensez que cette réponse vous a aidé à résoudre votre problème, veuillez l'indiquer comme «accepté» en cliquant sur la coche verte. Cela aidera la communauté à se concentrer sur les questions sans réponse. – Lahiru