Je ne vois pas de valeur pour les réducteurs dans Hadoop dans le scénario suivant:Quel est l'avantage des réducteurs dans Hadoop?
- Les tâches de cartes génèrent des clés uniques (Parce que nous pouvons fusionner à la fois la Map/Reduce fonctionnalité ensemble)
La sortie taille des tâches de la carte est trop grand (Cela épuise la mémoire si nous attendons les réducteurs pour commencer le travail)
Si nous avons une fonctionnalité qui n'a pas besoin de regroupement et de tri des clés
Corrigez-moi si je me trompe.
Et si quelqu'un pouvait me donner un vrai exemple des avantages des réducteurs et quand il devrait être utilisé, je l'apprécierai.
La 3ème déclaration est centrale. Si vous n'avez pas besoin de grouper, vous devez définir le nombre de réducteurs à 0. – fi11er
@ fi11er Merci pour les deux premières déclarations –
Tout dépend de votre tâche, vous ne pouvez pas faire d'agrégation sur les mappeurs (ou pouvez, mais vous le feriez probablement écrire votre propre réduire pour cela). 1) Si vous avez des clés uniques, vous n'avez généralement pas besoin de regrouper vos données, vous n'avez donc pas besoin de réducteur. 2) cela ne dépend pas de la taille, si vous voulez agréger la sortie de la carte, vous allez ajouter un réducteur. – fi11er