J'essaie d'activer le mauvais saut d'entrée sur mes travaux Amazon Elastic MapReduce. Je suis la merveilleuse recette décrite ici:Réglage des paramètres hadoop avec boto?
http://devblog.factual.com/practical-hadoop-streaming-dealing-with-brittle-code
Le lien ci-dessus dit que je dois mettre en quelque sorte les paramètres de configuration suivants sur un travail DME:
mapred.skip.mode.enabled=true
mapred.skip.map.max.skip.records=1
mapred.skip.attempts.to.start.skipping=2
mapred.map.tasks=1000
mapred.map.max.attempts=10
Comment puis-je configurer ces (et autre) paramètres mapred.XXX sur un JobFlow utilisant Boto?
Merci! Cela a fonctionné pour moi. Cela fonctionne parfois quand je spécifie les mêmes paramètres avec ['-D', '...'] pour le même ensemble de valeurs avec un "step" au lieu d'un bootstrap, mais l'ajout de cette étape bootstrap semble rendre cette balle preuve. – Suman