Je sais que le nombre de mappeur peut être défini en fonction de ma taille de division dfs en définissant mapred.min.split.size sur dfs.block.size.Comment définir dynamiquement le nombre de réducteurs en fonction de ma taille de sortie de mappeur?
Similaire comment peut-on définir I le nombre de réducteurs en fonction de ma taille de sortie de mappeur? PS: Je sais que les options ci-dessous peuvent être utilisées pour manipuler le nombre de réducteur. mapred.tasktracker.reduce.tasks.maximum mapred.reduce.tasks
@Merla: Merci pour la réponse. Mais toujours les suggestions ne fournissent pas une option pour les changer dynamiquement pendant le travail en cas de différence de volume lors du traitement des données. – Makubex
Je ne pense pas que vous pouvez changer dynamiquement le nombre de réducteurs une fois que la carte a réduit le travail commencé. Autant que je sache, il n'y aurait aucune interaction humaine de fournir des valeurs pendant le travail est en cours d'exécution.Il devrait être préconfiguré. Le travail de réduction de carte est un processus de traitement par lots (dure longtemps), ainsi il est difficile pour l'utilisateur de savoir quand il demandera à l'utilisateur le nombre de réducteurs et il n'est pas conçu pour être interactif pendant ce processus! J'espère que vous avez la réponse !! –