Je cours un travail de mapreduce qui a lu l'entrée et le trie en utilisant plusieurs réduit. Je peux obtenir la sortie triée avec le nombre de réducteurs à 5. Cependant, la sortie est écrite à seuleme
Comment spécifier TotalOrderPartitioner lors de l'utilisation de mrjob? Est-ce la valeur par défaut ou doit-elle être spécifiée explicitement? J'ai vu un comportement incohérent sur différents ensembl