Cela m'a été demandé ..Combien de mappeur est utilisé dans la ruche pour traiter le tableau de 1 Go
S'il y a 10 noeuds et le tableau de 1 Go est nécessaire de traiter dans la ruche. Alors, combien de mappeur est utilisé?
Cela m'a été demandé ..Combien de mappeur est utilisé dans la ruche pour traiter le tableau de 1 Go
S'il y a 10 noeuds et le tableau de 1 Go est nécessaire de traiter dans la ruche. Alors, combien de mappeur est utilisé?
Comment déterminer le nombre de mappeurs?
Il est relativement facile de déterminer mais plus difficile de contrôler le nombre de mappeurs par rapport au nombre de réducteurs. Le nombre de mappeurs peut être déterminé comme suit: Déterminez d'abord que les fichiers d'entrée sont divisibles ou non. Les fichiers GZipped et certains autres fichiers compressés ne peuvent pas être divisés par Hadoop. Les fichiers texte normaux, les documents JSON, etc. sont séparables.
Si les fichiers sont sécable:
Si les fichiers ne sont pas séparables:
De plus, le format de fichier joue également un rôle.
Salut Nidhin, Depuis, c'est la table Hive (HDFS). Je pense que le fractionnement a déjà été fait. En travaillant avec hadoop, il est bon de dire «nombre de split = nombre de mappeurs». Mais c'est un travail à Hive? – user1999758
est-ce un casse-tête? – YoungHobbit
c'est l'une des questions que je pose dans les interviews ... cela dépend de la configuration de la table, de son format de fichier et de la configuration de HDFS. –
Roberto Merci de répondre, pouvez-vous être plus bref à ce sujet? Merci beaucoup à l'avance – user1999758