Je suis en train d'exécuter un travail d'étincelle dans EMR avec YARN en tant que gestionnaire de ressources et sur 2 nœuds. J'ai besoin d'échouer volontairement l'étape si ma condition n'est pas remplie, donc l'étape suivante ne s'exécute pas selon la configuration. Pour ce faire, je lance une exception personnalisée, après l'insertion d'un message de journal dans dynamoDB.Spark, Comportement incorrect lors du lancement de SparkException dans EMR
Cela fonctionne bien mais l'enregistrement dans Dynamo est inséré deux fois.
Voici mon code. Si je supprime la ligne pour lancer une exception, cela fonctionne correctement, mais l'étape est terminée.
Comment puis-je faire échouer l'étape, sans recevoir le message de journal deux fois.
Merci pour l'aide.
Cordialement, Sorabh