Pourquoi le nombre de godets dans la ruche doit-il être égal au nombre de réducteurs?

apache
hadoop
hive
partitioning
buckets

2017-08-03 2 views 0 likes

Dans la ruche, pourquoi le nombre de seaux devrait être égal au nombre de réducteurs?Pourquoi le nombre de godets dans la ruche doit-il être égal au nombre de réducteurs?

Source

2017-08-03 Ramprakash Reddymasi

Répondre

Parce que c'est la façon la plus optimisée de travailler pour mapreduce (toutes choses égales par ailleurs). Les tâches seront réparties entre les réducteurs.

Dans la ruche 0.x et 1.x, vous devez spécifier les éléments suivants: hive.enforce.bucketing = true. Cela signifie que le nombre de réducteurs sera automatiquement déterminé en fonction du nombre de compartiments dans votre tableau. Dans les versions ultérieures de hive (2.x), ceci est défini par défaut.

Source: https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL+BucketedTables

Source

2017-09-18 09:56:51 bigdatadev

Pourquoi le nombre de godets dans la ruche doit-il être égal au nombre de réducteurs?

Répondre

Questions connexes