2017-06-26 1 views
1

J'ai configuré un cluster Hadoop avec Hortonworks Data Platform 2.5. J'utilise 1 maître et 5 esclaves (travailleurs).Hortonworks Data Platform: Une charge élevée provoque le redémarrage du nœud

Tous les quelques jours, un (ou plusieurs) de mes nœuds de travail reçoit une charge élevée et semble redémarrer automatiquement tout le système d'exploitation CentOS. Après le redémarrage, les composants Hadoop ne fonctionnent plus et doivent être redémarrés manuellement via l'interface de gestion Amabri.

Voici une capture d'écran du « écrasé » noeud (redémarrage après la haute valeur de charge ~ il y a 4 heures): enter image description here

Voici une capture d'écran d'un d'un autre noeud travailleur « en bonne santé » (tous les autres travailleurs ont les mêmes Valeurs):

Les plots de nœud alternent entre les 5 nœuds de travail, le nœud principal semble fonctionner sans problèmes.

Ce qui pourrait causer ce problème? D'où viennent ces valeurs de charge élevée?

Répondre

0

Cela semble être un problème de noyau, comme le fichier journal (par exemple /var/spool/abrt/vmcore-127.0.0.1-2017-06-26-12:27:34/backtrace) dit quelque chose comme

Version: 3.10.0-327.el7.x86_64 
BUG: unable to handle kernel NULL pointer dereference at 00000000000001a0 

Après l'exécution d'un sudo yum update j'ai eu la version du noyau

[[email protected] ~]# uname -r 
3.10.0-514.26.2.el7.x86_64 

Depuis le système d'exploitation met à jour le problème ne s'est plus produit. Je vais observer le problème et donner des commentaires si nécessaire.