2011-07-30 4 views
7

Je développe une application Web pour fournir certains services. Ceci est une application scientifique qui effectue un traitement sur les données téléchargées par les utilisateurs. Les méthodes correspondant à ces actions de traitement sont écrites en Java et elles sont complètement indépendantes . Évidemment, les données des différents utilisateurs sont également indépendantes.Traitement parallèle Java sur les systèmes de cluster (cluster computing)

Je cherche une technique pour mettre à l'échelle ce calcul sur un cluster comme MPI en C. Je suis à la recherche du même outil en Java.

Merci.

+0

avez-vous regardé Hadoop? –

+0

Je suppose que la configuration d'un cluster HADOOP nécessite des efforts substantiels, n'est-ce pas? – cartoonist

+1

Il existe des entreprises (comme Cloudera) qui empaquetent le logiciel hadoop pour un déploiement (relativement) facile sur EC2. Mais oui, il y a une courbe d'apprentissage à la fois pour utiliser Hadoop et pour gérer vos clusters. Je ne sais pas comment cela se compare à GridGain, car je n'ai jamais utilisé ce dernier. –

Répondre

7

Vous avez beaucoup de solutions à l'échelle computings avec Java, mais celui que je préfère, et qui a le code le plus straighforward pour commencer est Gridgain

Vous pouvez avoir un essai avec Hazelcast qui est une donnée -grid, techniquely, mais peut être utilisé pour l'exécution à distance et parallélisation d'action sur un cluster

Si vous êtes à la recherche pour la mise en œuvre MPI explicitement, vous devriez jeter un oeil à MPJ