Je veux obtenir un ordre décroissant et arrondir à nombre entier zhvi
à partir d'un fichier csv en utilisant étincelle.Comment mettre les moyennes dans l'ordre décroissant?
Cependant, lorsque j'essaie sort(desc("Zhvi"))
à la fin de mon code. Ça me donne toujours une erreur.
from pyspark.sql.functions import col, desc
stateByZhvi = home.select('State','Zhvi').groupBy((col("State"))).avg("Zhvi").show()
et une partie de mon résultat:
+-----+------------------+
|State| avg(Zhvi)|
+-----+------------------+
| AZ|246687.01298701297|
| SC|143188.94736842104|
| LA|159991.74311926606|
| MN|236449.40239043825|
| NJ| 367156.5637065637|
| DC| 586109.5238095238|
| OR| 306646.3768115942|
| VA| 282764.4986449864|
Tout le monde peut aider?
vous trier (desc ("Zhvi")) sur les données moyennes groupées. ? – Suresh