Dans la ruche, pourquoi le nombre de seaux devrait être égal au nombre de réducteurs?Pourquoi le nombre de godets dans la ruche doit-il être égal au nombre de réducteurs?
0
A
Répondre
0
Parce que c'est la façon la plus optimisée de travailler pour mapreduce (toutes choses égales par ailleurs). Les tâches seront réparties entre les réducteurs.
Dans la ruche 0.x et 1.x, vous devez spécifier les éléments suivants: hive.enforce.bucketing = true. Cela signifie que le nombre de réducteurs sera automatiquement déterminé en fonction du nombre de compartiments dans votre tableau. Dans les versions ultérieures de hive (2.x), ceci est défini par défaut.
Source: https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL+BucketedTables