2012-02-02 7 views
0

Le facteur de réplication dans HDFS doit être d'au moins 3. Malgré le fait que le choix principal soit de 3, la tolérance aux pannes et la possibilité d'une panne de rack sont bien inférieures à la possibilité d'une panne de nœud. il y a une autre raison derrière le facteur de réplication pour être au moins 3?comment le facteur de réplication HDFS est-il décidé?

Répondre

3

Il n'y a aucune raison pour que le facteur de réplication soit de 3, c'est la valeur par défaut fournie par hadoop. Vous pouvez définir le niveau de réplication individuellement pour chaque fichier dans HDFS. En plus de la tolérance aux pannes, les réplicas permettent aux travaux qui consomment les mêmes données d'être exécutés en parallèle. Aussi, s'il y a des répliques des données, hadoop peut essayer d'exécuter plusieurs copies de la même tâche et prendre ce qui finit toujours en premier. Ceci est utile si, pour une raison quelconque, une boîte est lente.

Questions connexes