2017-08-04 1 views
0

Nous utilisons un cluster Vertica à 3 nœuds. La connexion réseau entre les nœuds échoue parfois pendant une courte période (ex: 10 secondes). Lorsque cela se produit, tous les nœuds s'arrêtent rapidement dès qu'ils détectent que d'autres nœuds sont inaccessibles (car k-safety ne peut pas être satisfait). Par exemple, la séquence suivante est enregistrée dans le journal de Vertica par le node0003:Comment retarder l'arrêt du noeud Vertica lorsque l'évaluation k-safety échoue?

00:04:30.633 node v_feedback_node0001 left the cluster 
... 
00:04:30.670 Node left cluster, reassessing k-safety... 
... 
00:04:32.389 node v_feedback_node0002 left the cluster 
... 
00:04:32.414 Changing node v_feedback_node0003 startup state from UP to UNSAFE 
... 
00:04:33.425 Shutting down this node 
... 
00:04:38.547 node v_feedback_node0003 left the cluster 

Est-il possible de configurer un délai après lequel chaque noeud essaiera de se reconnecter à d'autres avant d'abandonner et d'arrêter?

Répondre

0

Vous avez une réponse d'un employé de Vertica sur le Vertica forum.

Ce temps de [délai de reconnexion] est codé en dur sur 8 secondes.

Je pense que le temps est mieux utilisé pour rendre le réseau plus fiable. 30 sec de panne de réseau est beaucoup (je veux dire vraiment, vraiment grand, généralement rtt réseau est dans les microsecondes). Même si vous maintenez Vertica à en retardant l'évaluation K-safe, rien ne peut vraiment se connecter à la base de données , ou très probablement toutes les connexions db peuvent être réinitialisées.