2010-09-16 2 views

Répondre

2

Oui, vous pouvez. Vous pouvez même créer une machine virtuelle et l'exécuter sur un seul "ordinateur" (ce que j'ai :)).

La clé est d'installer simplement Hadoop dans "Pseudo Distributed Mode" qui est même décrit dans le Hadoop Quickstart.

Si vous utilisez la distribution Cloudera, ils ont même créé les configurations nécessaires pour cela dans un RPM. Look here for more info in that.

HTH

2

Oui. Dans mon environnement de développement, je lance

  • NameNode (HDFS)
  • SecondaryNameNode (HDFS)
  • DataNode (HDFS)
  • JobTracker (MapReduce)
  • TaskTracker (MapReduce)
  • Maître (HBase)
  • RegionServer (HBase)
  • QuorumPeer (ZooKeeper - nécessaire pour HBase)

De plus, j'exécute mes applications et mappe et réduit les tâches lancées par le traqueur de tâches. L'exécution de nombreux processus sur la même machine entraîne de nombreux conflits pour les cœurs de processeur, la mémoire et les E/S disque. Il n'est donc pas idéal pour les hautes performances, mais il n'y a pas d'autres ressources disponibles.

2

même ici, je courais Hadoop/HBase/ruche sur un seul ordinateur. Si vous voulez vraiment vraiment voir l'informatique distribuée sur un seul ordinateur, prenez beaucoup de RAM, l'espace disque dur et aller comme ça -

  1. font une ou deux machines virtuelles (utiliser la boîte virtuelle)
  2. installer hadoop sur chacun d'entre eux, faites votre installation réelle (pas un virtuel) comme le maître, reste esclave
  3. configurer hadoop pour l'environnement réel distribué
  4. maintenant quand hadoop commence, vous devriez avoir un cluster de plusieurs ordinateurs (un réel, repos virtuel)

cela pourrait être une expérience, car à moins d'avoir un système multi-cpu ou multicœur décent, une telle configuration consommera plus sur le maintien lui-même que de vous donner des performances.

gud chance.

--l4l

Questions connexes