Je suis en train de mettre à jour un cluster EMR en cours d'exécution avec installation pip sur toutes les machines esclaves. Comment puis je faire ça?Exécuter la commande sur les esclaves EMR?
Je ne peux pas le faire avec une étape bootstrap car c'est un EMR de longue durée et je ne peux pas l'enlever. Le cluster EMR exécute Spark & Yarn, donc j'utiliserais normalement spark slaves.sh, mais je ne trouve pas ce script sur le nœud maître. Est-il installé dans un endroit que je n'ai pas trouvé? Ou y a-t-il un moyen de l'installer?
J'ai vu d'autres questions qui disent utiliser le fil distribué-shell, mais je ne trouve pas d'exemple pratique pour le faire. Par ailleurs, le cluster utilise EMR 4.8.0, Spark 1.6.1, je crois.
Essayez des outils comme ansible/Saltstack pour atteindre vos objectifs. Ou essayez ce script Linux - https://hvivani.com.ar/2015/06/19/yarn-execute-a-script-on-all-the-nodes-of-the-cluster/. – annunarcist