2017-08-08 1 views
1

J'utilise bosco pour recueillir des informations sur le temps de réponse moyen d'un disque dur (win.disk.duration), il produit un graphique tel que:Comment utiliser win.disk.duration dans Bosun ou comment sous-échantillonner une métrique de type compteur?

enter image description here

Je comprends que cela montre le taux de changement de la valeur signalée par WMI, AvgDiskSecPerRead. Ce que je veux faire est de sous-échantillonner cette valeur calculée en prenant le maximum sur une période de temps. Toutefois, si je mets un sous-échantillonnage de Max avec une fenêtre de 5m je reçois ceci:

enter image description here

Notez le changement d'échelle de l'axe Y.

Comment puis-je sous-échantillonner le taux pour obtenir les résultats que j'attends (ou pourquoi ce que je demande n'est pas logique)?

Répondre

1

Actuellement puisqu'il s'agit d'un compteur, vous ne pouvez pas le sous-échantillonner correctement avec OpenTSDB (la source de données que je suppose que vous utilisez en raison des balises de question). En effet, OpenTSDB a mal calculé le calcul pendant la conception et cela n'a pas encore été corrigé. Plus d'informations dans ce Google groups thread. En bref, le calcul du taux (dérivé) doit être plus tôt dans l'ordre des opérations.

En outre, sachez qu'actuellement de notre côté (scollector) nous semblons avoir foiré une métrique connexe win.disk.percent_time qui doit encore être regardée dans (suivi dans ce issue).

+0

Merci pour l'explication et le lien. A en juger par l'âge de ce fil, je ne retiens pas mon souffle. –

0

Il semble que cette transformation concerne l'application de l'agrégation à la première dérivée. Voici un example en utilisant win.disk.duration métrique de scollector mais sur un backend différent.

  1. Les données brutes représentent un compteur avec réinitialisation.
  2. La première dérivée calcule le taux de variation sur un intervalle défini par l'utilisateur (1 seconde). Le delta négatif est traité comme une réinitialisation par défaut, mais ce comportement peut être controlled avec le paramètre rate-counter=true|false.
  3. La fonction d'agrégation max est appliquée au débit sur une période définie par l'utilisateur (5 minutes).

Je recommande cependant d'utiliser la fonction 95 percentile au lieu de max. La statistique p95 vous permet de discards pointes peu fréquentes à partir de l'analyse.

rate of change

Disclaimer: Je travaille pour Axibase.