J'ai fait un cluster apache autonome avec 7 pcs. Pour exécuter le code scala, le code estSpark formulaire de données formulaire
/** Our main function where the action happens */
def main(args: Array[String]) {
// Set the log level to only print errors
Logger.getLogger("org").setLevel(Level.ERROR)
// Create a SparkContext without much actual configuration
// We want EMR's config defaults to be used.
val conf = new SparkConf()
conf.setAppName("MovieSimilarities1M")
val sc = new SparkContext(conf)
val input = sc.textFile("file:///home/ralfahad/LearnSpark/SBTCreate/customer-orders.csv")
val mappedInput = input.map(extractCustomerPricePairs)
val totalByCustomer = mappedInput.reduceByKey((x,y) => x + y)
val flipped = totalByCustomer.map(x => (x._2, x._1))
val totalByCustomerSorted = flipped.sortByKey()
val results = totalByCustomerSorted.collect()
// Print the results.
results.foreach(println)
}
}
étapes sont:
Je créer un fichier .jar à l'aide de SBT
soumettre le travail à l'aide étincelles soumettre * .jar
Mais mon exécuteur testamentaire ne peut pas localiser sc.textFile("file:///home/ralfahad/LearnSpark/SBTCreate/customer-orders.csv")
Ce fichier client orders.csv est stocké dans mon PC maître.
stacktrace complète:
error: [Stage 0:> (0 + 2)/2]17/09/25 17:32:35 ERROR TaskSetManager: Task 0 in stage 0.0 failed 4 times; aborting job Exception in thread "main" org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 0.0 failed 4 times, most recent failure: Lost task 0.3 in stage 0.0 (TID 5, 141.225.166.191, executor 2): java.io.FileNotFoundException: File file:/home/ralfahad/LearnSpark/SBTCreate/customer-orders.csv does not exist
Comment puis-je résoudre ce problème?
Veuillez modifier le code à exécuter dans mon cluster.
erreur: [Étape 0:> (0 + 2)/2] 17/09/25 17:32:35 ERREUR TaskSetManager: Tâche 0 dans l'étape 0.0 a échoué 4 fois; abandon de travail Exception dans le fil "principal" org.apache.spark.SparkException: travail annulé en raison d'un échec de la phase: tâche 0 à l'étape 0.0 échoué 4 fois, échec le plus récent: Tâche perdue 0.3 à l'étape 0.0 (TID 5, 141.225.166.191, exécuteur 2): java.io.FileNotFoundException: Fichier fichier: /home/ralfahad/LearnSpark/SBTCreate/customer-orders.csv n'existe pas –