2017-08-09 1 views
0

Je travaille sur un projet SAS ETL dans lequel nous extrayons d'abord des données du dernier mois à partir de l'entrepôt de teradata au début de chaque mois, puis nous les déployons pour le traitement. Cela se fait via des scripts d'extraction pour chaque table, puis les données sont stockées dans une structure de dossiers mensuelle (aaaaamm). Après avoir travaillé de cette façon pendant plusieurs mois, nous avons commencé à recevoir des requêtes pour produire des extraits quotidiens, hebdomadaires, etc. La structure actuelle du dossier de stockage de données est la suivante:Suggestions de structure de fichiers SAS Data Mart

Bibliothèque/Données/Dossier YYYYMM dans une bibliothèque.

Je dois changer la structure (avec un impact minimal sur la structure actuelle) pour répondre aux demandes de délais différents comme Quotidien, hebdomadaire, bimensuelle, trimestrielle, etc.

Je pensais que deux options: Dans la structure actuelle (dossiers mensuels), ajoutez dans

  • quotidienne, hebdomadaire et dossiers mensuels
  • Bibliothèque/YYYYMM/mois
  • Bibliothèque/YYYYMM/Daily
  • Bibliothèque/YYYYMM/Hebdomadaire

dossiers.

Option 2: Dans la bibliothèque de données Créer des dossiers comme

  • mensuel
  • Daily
  • hebdomadaire
  • tous les quinze jours
  • trimestriel

Dans chacun de ces existe individuels dossiers avec th e date/mois/trimestre en cours. Quelqu'un peut-il suggérer d'autres approches de conception plus pratiques?

Répondre

0

Peut-être que les ensembles de données de génération SAS serait une option: http://support.sas.com/documentation/cdl/en/lrcon/62955/HTML/default/viewer.htm#a000934566.htm

Voici un extrait de SAS:

Un ensemble de données de génération est une version archivée d'un ensemble de données SAS qui sont stockées dans le cadre de un groupe de génération. Un ensemble de données de génération est créé chaque fois que le fichier est remplacé. Chaque ensemble de données de génération dans un groupe de génération a le même nom de membre racine, mais chacun a un numéro de version différent. La version la plus récente de l'ensemble de données de génération est appelée la version de base.

+0

Merci pour votre réponse Zuluk, mais ce serait comme compliquer le processus actuel encore plus loin. Je souhaite ajouter une nouvelle structure de fichier avec des mises à jour minimales des processus existants. Pouvez-vous suggérer une autre option pour ajouter des ensembles de données périodiques? – Rhea

+0

Non, cependant votre première option me semble la mieux applicable. – zuluk