2015-03-10 1 views
0

J'ai quelques "dimensions" différentes, principalement hiérarchiques. Je voudrais exécuter certaines métriques enregistrées à des niveaux individuels dans la hiérarchie. Lorsque vous naviguez dans cette structure hiérarchique, les statistiques sont mises à jour en fonction de votre sélection actuelle.Stratégies pour l'analyse en temps quasi réel

Dans les systèmes OLAP traditionnels, vous disposez de tables de dimension avec une table de faits et vous effectuez un ETL pour importer des données dans votre entrepôt de données et exécuter les requêtes correspondantes. J'aimerais le faire presque en temps réel. En faisant cela en temps réel, les ETL doivent être exécutés en temps quasi réel (probablement des points de données mis en cache en mémoire). Si la structure hiérarchique est (X -> Y -> Z), alors si j'ai 5 Xs, 2 Ys et 5 Zs comme dimension, alors j'ai besoin d'exécuter (5 * 2 * 5) => 50 requêtes pour obtenir la table des faits peuplée? Si cette hiérarchie devient plus grande, je peux facilement lancer des millions de requêtes. Je ne suis pas sûr si je pense correctement à ce problème, il serait très utile si quelqu'un avec une expérience d'analyse de données en temps réel peut partager leur expérience.

+0

Je pense que ce serait beaucoup plus facile à comprendre si vous pouviez expliquer la structure réelle de la table - est-ce que X, Y et Z sont des tables de dimensions séparées? Ou une hiérarchie intégrée dans une table de dimension? De vrais noms et des informations sur leur relation aideraient aussi. Je ne comprends pas les 50 requêtes ou les millions de requêtes potentielles à ce stade, mais je soupçonne avec ce genre d'information que cela serait beaucoup plus clair! –

Répondre

-1

Je ne comprends pas pourquoi vous auriez besoin de millions de requêtes pour mettre à jour vos données de faits. Un simple 'incremental-id' par table pourrait indiquer au système OLAP quelles lignes doivent être chargées chaque fois que les données doivent être rafraîchies.

Peut-être que vous pouvez jeter un oeil à icCube qui permet de près de real-time analytics; Comme les cubes ne mettent pas en cache d'agrégation, chaque fois que de nouvelles données ont été chargées, elles sont prêtes à être interrogées.