ce sont mes pas:retards énormes traduisant la DAG à des tâches
- Soumettre l'application étincelle à un cluster DME
- Le pilote démarre et je peux voir le Spark-ui (aucune étape n'a encore été créé
- Le pilote lit un fichier orc avec ~ 3000 parties de s3, effectue quelques transformations et le sauvegarde dans s3
- L'exécution de la sauvegarde devrait créer quelques étapes dans le spark-ui mais les étapes prennent beaucoup de temps apparaître dans l'étincelle-ui
- Les étapes apparaissent et commencent l'exécution
Pourquoi est-ce que j'obtiens ce délai énorme à l'étape 4? Pendant ce temps, le groupe attend apparemment quelque chose et l'utilisation du processeur est 0%
Merci