Hortonworks Data Platform: Une charge élevée provoque le redémarrage du nœud

J'ai configuré un cluster Hadoop avec Hortonworks Data Platform 2.5. J'utilise 1 maître et 5 esclaves (travailleurs).Hortonworks Data Platform: Une charge élevée provoque le redémarrage du nœud

Tous les quelques jours, un (ou plusieurs) de mes nœuds de travail reçoit une charge élevée et semble redémarrer automatiquement tout le système d'exploitation CentOS. Après le redémarrage, les composants Hadoop ne fonctionnent plus et doivent être redémarrés manuellement via l'interface de gestion Amabri.

Voici une capture d'écran du « écrasé » noeud (redémarrage après la haute valeur de charge ~ il y a 4 heures):

Voici une capture d'écran d'un d'un autre noeud travailleur « en bonne santé » (tous les autres travailleurs ont les mêmes Valeurs):

Les plots de nœud alternent entre les 5 nœuds de travail, le nœud principal semble fonctionner sans problèmes.

Ce qui pourrait causer ce problème? D'où viennent ces valeurs de charge élevée?

Source

2017-06-26 D. Müller

Cela semble être un problème de noyau, comme le fichier journal (par exemple /var/spool/abrt/vmcore-127.0.0.1-2017-06-26-12:27:34/backtrace) dit quelque chose comme

Version: 3.10.0-327.el7.x86_64 
BUG: unable to handle kernel NULL pointer dereference at 00000000000001a0

Après l'exécution d'un sudo yum update j'ai eu la version du noyau

[[email protected] ~]# uname -r 
3.10.0-514.26.2.el7.x86_64

Depuis le système d'exploitation met à jour le problème ne s'est plus produit. Je vais observer le problème et donner des commentaires si nécessaire.

Source

2017-07-13 08:02:53

Hortonworks Data Platform: Une charge élevée provoque le redémarrage du nœud

Répondre

Questions connexes