Lire le fichier csv comme trame de données dans l'étincelle

apache-spark

2016-04-12 2 views -2 likes

-2

Je suis nouveau à étincelle et j'ai un fichier csv avec plus de 1500 colonnes. J'aime le charger comme un dataframe en étincelle. Je ne suis pas sûr de savoir comment faire cela. MerciLire le fichier csv comme trame de données dans l'étincelle

Source

2016-04-12 user2145299

Répondre

Utilisez ce projet https://github.com/databricks/spark-csv

Il est un exemple de la première page:

import org.apache.spark.sql.SQLContext 

val sqlContext = new SQLContext(sc) 
val df = sqlContext.read 
    .format("com.databricks.spark.csv") 
    .option("header", "true") // Use first line of all files as header 
    .option("inferSchema", "true") // Automatically infer data types 
    .load("cars.csv")

Source

2016-04-12 21:51:25 Fab

Lire le fichier csv comme trame de données dans l'étincelle

Répondre

Questions connexes