0

J'essaie de comprendre quelle est la meilleure pratique pour agréger et rouler des données de séries chronologiques Cassandra.Cassandra séries chronologiques roll-ups sans Opscenter

Je suis tombé sur ce this page qui mentionne Opscenter peut être utilisé pour les roll-ups, mais je ne pense pas que cela fonctionnera pour moi puisque je n'utilise pas la version d'entreprise de Cassandra. Je souhaite regrouper les données de séries chronologiques dans plusieurs compartiments (1 minute, 30 minutes, 1 heure, 4 heures, 12 heures, 1 jour, 3 jours, etc.).

Je voudrais utiliser ces données pour générer des graphiques pour diverses résolutions temporelles, similaires à bitcoinwisdom.

Quelle est l'approche recommandée pour la mise en œuvre de cela? Je suis nouveau à Cassandra.

Répondre

2

Cette page décrit comment OpsCenter exécute les roll-ups, et non qu'elle peut être utilisée pour les roll-ups.

D'après ce que je peux recueillir OpsCenter effectue les opérations suivantes:

  • les points de données sont stockées dans une table/columnfamily, calée par (id métrique, horodatage)
  • agrège (min, max, avg) les points de données individuels en plusieurs cumuls (1min, 5min, 2h & 24h), à la volée et en mémoire
  • à la fin de la période de enroulable les agrégats sont stockés dans leurs propres tables/columnfamilies

Si cette approche fonctionne pour vous dépend à 100% sur votre cas d'utilisation: la quantité de données que vous êtes recevoir et combien voulez-vous stocké, comment vous voulez agréger les données [c.-à-d. pour les plus grandes périodes de temps, min et max peuvent être calculés avec précision à partir de plus petits, mais pour quelque chose comme la moyenne, il y a une certaine perte de précision] et ainsi de suite.