J'ai exécuté plusieurs tâches de réduction de mappage sur un cluster hadoop à partir d'un seul fichier JAR. La partie principale du fichier JAR accepte un fichier XML en tant que paramètre de ligne de commande. Le fichier XML contient les chemins d'entrée et de sortie pour chaque travail (paires de propriétés nom-valeur) et je les utilise pour configurer chaque travail mapreduce. Je suis en mesure de charger les chemins dans la configuration comme siAmazon EMR: Transmission d'un fichier XML ou d'un fichier de propriétés à un fichier JAR
Configuration config = new Configuration(false);
config.addResource(new FileInputStream(args[0]));
Je suis maintenant en train d'exécuter le JAR à l'aide d'Amazon Elastic MapReduce. J'ai essayé de télécharger le fichier XML en S3 mais bien sûr en utilisant FileInputStream pour charger les données de chemins de S3 ne fonctionne pas (FileNotFound Exception).
Comment puis-je transmettre le fichier XML au JAR lors de l'utilisation de EMR?
(J'ai regardé les actions bootstrap mais pour autant que je sache, c'est pour spécifier des configurations spécifiques à hadoop).
Tout aperçu serait apprécié. Merci.
Merci, je vais essayer –
On dirait que cela a fonctionné. Je vous remercie!!! –