1

Mes grappes GKE ne sont pas surveillées par Stackdriver, malgré l'activation de Cloud Monitoring. En particulier https://app.google.stackdriver.com/gke signale simplement "Vous n'avez aucune ressource de ce type surveillée par Stackdriver".Les grappes GKE ne sont pas surveillées par StackDriver

  • Clusters en cours d'exécution Kubernetes 1.2.4, créé à la mi-mai 2016.
  • Certains avaient Cloud Monitoring permis la création, certains avaient elle a permis par gcloud container clusters update serve --monitoring-service=monitoring.googleapis.com.
  • Tous les clusters exécutent le module heapster avec 2/2 prêts, l'état de fonctionnement, aucun redémarrage, par ex. comme heapster-v1.0.2-594732231-76sdj.
  • Tous les clusters exécutent le service heapster avec une adresse IP de cluster, aucune adresse IP externe et le port 80/TCP.
  • Journaux de heapster pod, conteneur heapster ressemblent:

I0609 09: 15: 05,000189 1 manager.go: 79] métriques Grattage commencent: 09/06/2016 09:14:00 +0000 UTC, fin: 09/06/2016 09:15:00 UTC +0000

I0609 09: 15: 05,023729 1 manager.go: 152] ScrapeMetrics: temps: 23.435264ms taille: 25

  • Journaux de heapster pod, heapster-nanny récipient ressembler à:

I0609 09: 18: 1 03,968201 nanny_lib.go: 90] Le nombre de noeuds est égal à 1

I0609 09: 18: 1 03,971459 nanny_lib.go: 98] Les ressources conteneurs sont & {map [mémoire: {213.909.504,000000000 BinarySI} cpu: {0,100000000 DecimalSI}] map [cpu: {0,100000000 DecimalSI} mémoire: {213.909.504,000000000 BinarySI}]}

I0609 09: 18: 03,971522 1 nanny_lib.go: 102] Les ressources attendues sont & {map [cpu: {0.100000000 Decima LSi} mémoire: {218.103.808,000000000 BinarySI}] map [cpu: {} 0,100000000 DecimalSI mémoire: {218.103.808,000000000 BinarySI}]}

I0609 09: 18: 1 03,971634 nanny_lib.go: 106] Les ressources sont dans les limites prévues.

Répondre

2

Il s'avère que Stackdriver avait un problème d'affichage incorrect des clusters new-ish dans son interface utilisateur. Les métriques étaient correctement collectées et étaient disponibles via their API tout le temps. Le problème devrait maintenant être résolu, mais l'équipe est très désolée pour les problèmes que cela a causé et travaillera pour attraper des problèmes comme celui-ci plus rapidement.

+0

Je rencontre ce problème avec un cluster précédemment surveillé, qui a soudainement disparu de la liste des clusters surveillés. Un moyen d'obtenir de l'aide à ce sujet? –