1

Je travaille actuellement sur un schéma d'entrepôt utilisant approximativement une approche de modélisation dimensionnelle. Les idées générales sont d'avoir une seule table de faits, pleine de métriques d'événements d'intérêt, au plus bas niveau de granularité. Parallèlement à cela, il y aura bien sûr une table dimensionnelle (a) où les dimensions de l'événement en cours d'enregistrement seront conservées. Ces tables sont liées par un dimension_id. Ma question est la suivante: est-ce possible ou plutôt logique que quelque chose soit à la fois une dimension et une métrique?Est-ce qu'il est logique qu'une dimension soit aussi une métrique?

Un exemple serait peut-être la position d'un produit dans certains résultats de recherche. La position d'un produit donné peut être considérée comme une métrique; Les utilisateurs peuvent souhaiter exécuter la requête suivante pour un produit:

Quelle est la position moyenne des produits de dimension x = y la semaine dernière?

En même temps, la position pourrait lui-même être considéré comme une dimension:

Montrez-moi le taux de clics de tous les produits avec la position = 2 pour le dernier mois

Quelle est la bonne façon d'aborder quelque chose comme ça dans un entrepôt de données (nous examinons des solutions axées sur les colonnes si cela fait une différence).

+0

Voulez-vous dire "mesurer"? –

Répondre

0

Il me semble que dans les deux cas, vous êtes juste d'exécuter une requête sur la mesure dans le fait

produits avec position = 2 pour le dernier mois

La réflexion sur les méthodes de En générant ceci, ceci peut être dérivé en générant la bonne liste de produits hors de la table de faits à la volée, puis en limitant votre requête factuelle extérieure à ces produits. C'est très bien si vous avez un analyste capable d'exécuter SQL personnalisé, mais il est beaucoup plus difficile pour un analyste non technique de le construire dans n'importe quel outil de reporting que j'ai jamais utilisé.

OU

vous pouvez « durcir » votre position d'attribut dans une dimension changeant lentement. Mais pour les données qui changent rapidement, ce n'est généralement pas une option ... car votre dimension change si vite que cela n'est pas pratique. Si vous pouviez lier votre période d'analyse requise à un mois, il pourrait être pratique d'implémenter l'évaluation mensuelle (et de nombreux autres attributs, y compris les attributs de type période variable) dans une dimension qui change lentement, ce qui signifierait que vous auriez Au moins douze membres de la dimension produit par an, mais vous faites bouillir tous les KPI réalistes possibles dans une colonne de la dimension, ce qui est généralement très utile.

Mais je suppose que ce n'est pas quelque chose de nouveau pour vous.

+0

Je suppose que ma question est plus: dupliquez-vous un élément d'information (position) en stockant à la fois la table de faits en tant que métrique et une table de dimensions en tant qu'attribut ou ajustez-vous vos systèmes de reporting pour autoriser les requêtes d'agrégation sur les dimensions numériques.J'espère que cela a du sens. – Edwardr

+0

Selon moi, un entrepôt dimensionnel chargé par lot vous donne le luxe de reproduire toutes sortes d'informations pour plus de commodité et de rapidité. –

Questions connexes