2017-08-03 2 views

Répondre

0

Parce que c'est la façon la plus optimisée de travailler pour mapreduce (toutes choses égales par ailleurs). Les tâches seront réparties entre les réducteurs.

Dans la ruche 0.x et 1.x, vous devez spécifier les éléments suivants: hive.enforce.bucketing = true. Cela signifie que le nombre de réducteurs sera automatiquement déterminé en fonction du nombre de compartiments dans votre tableau. Dans les versions ultérieures de hive (2.x), ceci est défini par défaut.

Source: https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL+BucketedTables