J'ai une base de données pandas constituée de chaînes, c'est-à-dire 'P1', 'P2', 'P3', ..., null.Les données Pandas remplacent les chaînes avec NaN en utilisant pd.concat
Lorsque j'essaie de concaténer cette trame de données avec une autre, toutes les chaînes sont remplacées par 'NaN'.
Voir mon code ci-dessous:
descriptions = pd.read_json('https://raw.githubusercontent.com/ansymo/msr2013-bug_dataset/master/data/v02/eclipse/short_desc.json')
descriptions = descriptions.reset_index(drop=1)
descriptions['desc'] = descriptions.short_desc.apply(operator.itemgetter(0)).apply(operator.itemgetter('what'))
f1=pd.DataFrame(descriptions['desc'])
bugPrior = pd.read_json('https://raw.githubusercontent.com/ansymo/msr2013-bug_dataset/master/data/v02/eclipse/priority.json')
bugPrior = bugPrior.reset_index(drop=1)
bugPrior['priority'] = bugPrior.priority.apply(operator.itemgetter(0)).apply(operator.itemgetter('what'))
f2=pd.DataFrame(bugPrior['priority'])
df = pd.concat([f1,f2])
print(df.head())
La sortie est la suivante:
desc priority
0 Usability issue with external editors (1GE6IRL) NaN
1 API - VCM event notification (1G8G6RR) NaN
2 Would like a way to take a write lock on a tea... NaN
3 getter/setter code generation drops "F" in "..... NaN
4 Create Help Index Fails with seemingly incorre... NaN
Des idées quant à la façon dont je pourrais arrêter cela se produise? En fin de compte, mon but est d'avoir tout dans une seule trame de données afin que je puisse supprimer toutes les lignes avec des valeurs "nulles". Cela aiderait aussi plus tard dans le code.
Merci.
Nous vous remercions de votre aide, cet ensemble de données est déjà en train de conduire m noix, et ce n'est que l'importation de données! – JohnWayne360