J'ai développé des tâches MR utilisant java et hadoop 1.0.1. Cependant, EMR prend en charge uniquement jusqu'à Hadoop 0.20. Est-il possible d'exécuter des tâches Hadoop 1.0.1 sur EMR ou dois-je rétrograder ma pile de bibliothèque pour être conforme à la version hadoop d'EMR?Prise en charge des tâches Hadoop 1.0.1 sur Amazon EMR
Répondre
Dépend si vous utilisez des classes spécifiques 1.0.1 ou non. Les classes principales Mapper et Reducer (les deux nouveaux et anciens types d'API) n'ont pas changé entre 0.20 et 1.0.1.
Vous pouvez essayer de changer votre dépendance hadoop à 0.20.2 et reconstruire votre pot de travail MR - s'il n'y a pas d'erreurs de compilation, vous êtes assez proche (il peut y avoir quelques corrections de bogues entre 0.20 et 1.0.1 mais Imaginez que vous serez ok). Si vous trouvez que votre travail ne compile pas et que certains formats d'entrée/sortie ne sont pas disponibles en 0.20 (comme certaines entrées/sorties multiples), vous pouvez vérifier la source Hadoop pour 1.0. 1 (ou bien la source de Cloudera 0.20.2) pour voir si vous pouvez 'backport' les formats manquants et les ajouter ensuite dans votre pot de travail.
N'hésitez pas à renvoyer les erreurs de compilation dans vos questions d'origine pour que les gens puissent commenter les solutions possibles.
- 1. Prise en charge du client Python pour exécuter Hive sur Amazon EMR
- 2. Quelle version de Hadoop est utilisée par Amazon (EMR)?
- 3. Hadoop EMR utilisant Python
- 4. Impossible d'utiliser apache flink dans amazon emr
- 5. Comment est-ce que je peux tuer des tâches de carte en cours d'exécution sur Amazon EMR?
- 6. EMR Hadoop traitement fichier S3 entier
- 7. hadoop/emr comment stocker des paires clé-valeur
- 8. MRJob déterminant si exécuter en ligne, local, emr ou hadoop
- 9. Prise en charge des requêtes imbriquées DynamoDB
- 10. Prise en charge de MDX pour Hive (Hadoop)
- 11. Hadoop (1.0.1) erreur de compilation avec libssl
- 12. Amazon AWS EMR application d'exemple "non" configuration
- 13. Amazon EMR: utiliser le fichier .pigbootup
- 14. Comment augmenter les tâches de carte hadoop en implémentant getSplits
- 15. comment installer des paquets personnalisés sur amazon EMR bootstrap action dans le code?
- 16. Génération de fichiers Thrift PHP sur HBase Amazon EMR
- 17. Séparation des tâches Hadoop et Réduction des tâches
- 18. Prise en charge VoIP/Vidéo sur Blackberry
- 19. Prise en charge des threads verts JVM et systèmes d'exploitation prise en charge des threads natifs
- 20. Prise en charge LLVM JIT sur PowerPC?
- 21. Prise en charge de JDBC sur J2ME
- 22. R Réducteur ne fonctionne pas correctement dans Amazon EMR
- 23. Hadoop, exécution de tâches
- 24. Prise en charge des tailles d'écran PhoneGap
- 25. grep: opération non prise en charge sur la prise
- 26. Prise en charge des alias CNAME
- 27. Prise en charge des appareils/écrans Android
- 28. Prise en charge des IDN dans Android
- 29. Prise en charge d'une prise en charge de l'impression sur page Web
- 30. Quelques doutes élémentaires sur l'exécution des programmes MapReduce utilisant mrjob sur Amazon EMR