Je peux voir comment le hachage du contenu du champ et de la tâche Id ensemble est utilisé pour garder tous les tuples avec la même valeur dans un champ allant à la même tâche de boulon. Cependant, comment peut-on être assuré s'il y a plus d'un travailleur? Sûrement boulons tâches ne sont pas partagés entre les travailleurs?Le groupement de champs Apache Strom fonctionne-t-il avec plusieurs travailleurs?
0
A
Répondre
1
Le nombre de tâches est fixé lorsqu'une Topologie est créée et ne change jamais. Les commandes de rééquilibrage peuvent changer les exécuteurs qui hébergent une tâche, mais ils ne sont pas détruits. Par conséquent, les tuples ayant les mêmes valeurs de champ vont toujours à la même tâche, quel que soit le processus de travail ou l'exécuteur.
Vous avez peut-être déjà vu cela mais this est une bonne explication du parallélisme de Storm et fournit un peu plus de détails.