Nous avons une application de cluster Akkka (fragmentation de certains acteurs). Parfois, quand nous déployons et notre application devrait être mis hors que nous voyons certains journaux comme ça:CoordinatedShutdown timeout sur l'application de cluster Akka
phase d'arrêt Coordinated [cluster sharding-arrêt-région] chronométré après 10000 millisecondes
Cette se produit sur le premier déploiement après plus de 2 jours depuis le dernier déploiement (le lundi par exemple). Nous demandons au nœud akka de quitter le groupe avec l'aide JMX et nous avons le code suivant aussi:
actorSystem.registerOnTermination {
logger.error("Gracefully shutdown of node")
System.exit(0)
}
Ainsi, lorsque cette erreur se produit, éventuellement nœud quitte le cluster (ou du moins il ferme le point d'entrée JMX à gérer le cluster akka) mais le processus ne se termine pas et le journal "Fermeture du nœud" n'apparaît pas. Donc, lorsque cela se produit, nous devons arrêter le processus Java manuellement (nous traitons cela avec le superviseur) et redéployer.
Je sais que le délai d'attente peut être réglé via la configuration, mais quelles sont les implications de l'augmentation de ce délai? Pourquoi parfois une fermeture coordonnée entraîne un dépassement de délai? Que se passe-t-il lorsque le délai d'arrêt coordonné est dépassé?
Un indice serait apprécié: D
Merci