2017-10-08 1 views
-1

Je suis novice dans Hadoop et je ne connais pas la raison pour laquelle une machine virtuelle (VM) est utilisée pour exécuter et déployer Hadoop cluster et ses modules. Peut-on pas utiliser Hadoop dans le système Linux/Unix locauxPourquoi une machine virtuelle (VM) est-elle utilisée pour exécuter et déployer Hadoop cluster et ses modules?

+1

Veuillez faire un lien vers les instructions de déploiement auxquelles vous faites référence. – Thilo

+1

En fait, il est fortement recommandé d'utiliser du matériel physique pour Hadoop ... Votre question semble être plus sur pourquoi virtualiser que quelque chose de spécifique à propos de Hadoop –

+0

@Thilo: Il existe des instructions npdeployment. J'ai regardé quelques tutoriels et tout le monde utilisait Sandbox ou Cloudera, alors je me demandais pourquoi nous avions besoin d'une VM. – funnyguy

Répondre

0

la raison pour laquelle une machine virtuelle (VM) est utilisé pour exécuter et déployer clusters Hadoop et ses modules

Parce que beaucoup de centres de données avoir plus d'espace virtuel que d'espace physique. Des milliers de serveurs peuvent fonctionner sur des centaines de machines (environ). C'est ce que serait tout cluster Hadoop dans le nuage - un tas de machines virtualisées.

Parce que certaines entreprises veulent simplement une preuve de concept petite et bon marché, Haddon fonctionnera au sein de leur écosystème de logiciels existants. Parce qu'il est facile de démarrer une VM plutôt que de transporter plusieurs machines.

etc ...

Quoi qu'il en soit, je dirais qu'il est fortement recommandé d'utiliser du matériel physique, mais que les coûts du temps et des ressources pour maintenir en termes d'argent et de faire face aux défaillances matérielles et de garder le logiciel patché entre Hadoop et le système d'exploitation. Principalement, vous voudriez être en mesure de choisir et de choisir le matériel qui convient à vos cas d'utilisation. Beaucoup de stockage pour un "lac de données" ou beaucoup de mémoire pour un traitement rapide. Mélanger dans certains SSD pour la mise en cache rapide ...

Bien sûr, les machines virtuelles vous permettent d'allouer dynamiquement certains de ces éléments, mais quand un bâton de disque ou de la mémoire va corrompue, elle affecte toutes les machines virtuelles sur une machine plutôt que d'un serveur