Je suis nouveau à étinceler. J'ai une trame de données d'allumage:Obtenir des clés uniques à partir d'une base de données
print(df)
[Row(feature=Row(a=u'enabled', b=None, c=None, d=u'enabled', e=None, f=None)),
Row(feature=Row(a=None, b=None, c=None, d=u'enabled', e=None, f=None))]
Je suis en train d'obtenir tous les noms de fonctions dans une liste
experiments = [a, b, c, d, e]
J'ai essayé:
a = df.rdd.map(lambda r: r.feature).collect()
Cela me donne toutes les clés, des paires de valeurs .
ie. Comment puis-je obtenir des caractéristiques distinctes en tant que liste après l'étape ci-dessus ou existe-t-il une autre solution élégante?
[Row(a=u'enabled', b=None, c=None, d=u'enabled', e=None, f=None), Row(a=None, b=None, c=None, d=u'enabled', e=None, f=None)]
i.e.
final_list = [a, b, c, d, e, f]
Il dit: AttributeError: « liste » objet n'a pas d'attribut "colonnes de – SpaceOddity
@SpaceOddity parce que quelque part dans votre code converti votre dataframe à une liste .. l'échantillon 'df' est une liste. Vérifiez ma réponse mise à jour pour un autre moyen d'accéder aux clés de votre liste. – MedAli