2013-08-13 1 views
0

Je suis très novice en matière de cluster computing et je voulais en savoir plus sur les divers logiciels utilisés pour l'informatique en cluster, et ce qui convient le mieux à des tâches particulières. En particulier, le problème que j'essaie de résoudre implique un scénario de type Manager/Travailleur, où un seul responsable est responsable de la création de 100 à 1000 emplois. Chaque travail, bien que relativement important, doit s'exécuter petit à petit. C'est à dire. le gestionnaire dira à chaque travail «avancer d'une image et me rendre compte». L'exécution d'une seule trame sera très faible, de sorte que la latence entre le gestionnaire et les machines de travail doit être très faible, de l'ordre de quelques microsecondes.Meilleure méthode pour répartir un seul processus sur un cluster

Merci! Toute information serait appréciée, même des choses qui ne correspondent pas parfaitement au scénario que j'ai décrit, juste pour me donner un point de départ. Certains de ceux que j'ai étudiés jusqu'à présent sont Hadoop, HTCondor et Akka.

+0

Je ne connais pas les autres, mais Hadoop ne semble pas être un bon choix pour le traitement par lots hors ligne des mégadonnées. Ne ressemble pas vraiment à ce que vous avez décrit. – jbird

+0

Vous avez raison; Désolé, j'étais très tôt dans le processus de recherche quand j'ai demandé cela. Les candidats à l'utilisation sont maintenant JPPF, Akka, Twitter Storm, Open MPI et Open DDS. – jekelija

Répondre

0

Étant donné que la latence de communication est importante pour vous, vous devriez probablement envisager d'utiliser MPI. Il n'est pas trop difficile d'écrire de simples programmes Master/Worker en utilisant MPI, et il vous donnera probablement les meilleures performances, surtout si votre cluster a des performances réseau élevées, comme Infiniband.

Si vous utilisez Java, vous devrez faire quelques recherches pour déterminer un bon paquet Java/MPI. Vous trouverez quelques suggestions ici: Java openmpi.

+0

En fait, nous utilisons C++, mais nous n'avions tout simplement pas trouvé grand-chose pour le C++. OpenMPI semble génial, que savez-vous comment OpenDDS se compare? – jekelija

+0

@jekelija Je ne peux pas dire que je sache quoi que ce soit à propos d'OpenDDS, mais il semble que ce soit plus orienté vers l'informatique d'entreprise que vers le cluster computing. Cela peut valoir la peine d'être considéré, mais d'après votre description, il peut être plus lourd que ce dont vous avez besoin. –

Questions connexes