2010-10-12 7 views
0

J'ai deux ensembles de données avec le même niveau de granularité, par exemple le numéro de facture. La plupart des données requises sont mises à jour quotidiennement car nous reconnaissons les revenus des factures précédentes. Cependant, une partie de ces données est alimentée par un système de calcul des coûts séparé une fois par mois et est ensuite envoyée à l'entrepôt de données avec des informations supplémentaires. Dois-je créer une table de faits contenant les deux ensembles de données, puis exécuter une mise à jour sur la table de faits une fois par mois lorsque les autres données sont importées ou devrais-je créer deux tables de faits en raison du calendrier de mise à jour différent. Les données sont liées, et de nombreuses requêtes (~ 35%) rechercheront des informations provenant des deux ensembles de données (lorsqu'elles sont disponibles). Le système importe 30 000 lignes par jour dans la table de faits, il y a environ 38 000 000 lignes, la mise à jour mensuelle affecterait 660 000 lignes.Table de faits avec différents horaires de mise à jour

+0

Votre article ne précise pas si vous allez créer des entrées en double. "Certaines données sont transmises via un système de calcul des coûts". Cela signifie-t-il que cela n'a PAS été fait dans le DWH avant l'étape du système d'établissement des coûts ou est-ce que TOUTES les données sont envoyées au DWH et QUELQUES données sont ÉGALEMENT envoyées au système d'établissement des coûts? –

+0

Il n'y aurait pas de duplication. Les numéros qui sont introduits dans le système d'établissement des coûts seraient déjà dans l'entrepôt de données et ne seront pas réintégrés. Seuls les nouveaux éléments de données (faits) seraient insérés. –

Répondre

4

Si vous ne modifiez pas les mesures déjà existantes lors de la deuxième étape, vous pouvez traiter la table de faits comme un «instantané cumulatif». Le tableau décrit les processus avec un démarrage définitif et la fin des flux de travail. Regardez-le dans Data Warehouse Toolkit de Kimball ou simplement Google "Kimball accumulation table de faits instantanés".

+0

Cela ressemble à un grand match pour ce que je fais, merci. –

Questions connexes