Je travaille sur un projet SAS ETL dans lequel nous extrayons d'abord des données du dernier mois à partir de l'entrepôt de teradata au début de chaque mois, puis nous les déployons pour le traitement. Cela se fait via des scripts d'extraction pour chaque table, puis les données sont stockées dans une structure de dossiers mensuelle (aaaaamm). Après avoir travaillé de cette façon pendant plusieurs mois, nous avons commencé à recevoir des requêtes pour produire des extraits quotidiens, hebdomadaires, etc. La structure actuelle du dossier de stockage de données est la suivante:Suggestions de structure de fichiers SAS Data Mart
Bibliothèque/Données/Dossier YYYYMM dans une bibliothèque.
Je dois changer la structure (avec un impact minimal sur la structure actuelle) pour répondre aux demandes de délais différents comme Quotidien, hebdomadaire, bimensuelle, trimestrielle, etc.
Je pensais que deux options: Dans la structure actuelle (dossiers mensuels), ajoutez dans
- quotidienne, hebdomadaire et dossiers mensuels
- Bibliothèque/YYYYMM/mois
- Bibliothèque/YYYYMM/Daily
- Bibliothèque/YYYYMM/Hebdomadaire
dossiers.
Option 2: Dans la bibliothèque de données Créer des dossiers comme
- mensuel
- Daily
- hebdomadaire
- tous les quinze jours
- trimestriel
Dans chacun de ces existe individuels dossiers avec th e date/mois/trimestre en cours. Quelqu'un peut-il suggérer d'autres approches de conception plus pratiques?
Merci pour votre réponse Zuluk, mais ce serait comme compliquer le processus actuel encore plus loin. Je souhaite ajouter une nouvelle structure de fichier avec des mises à jour minimales des processus existants. Pouvez-vous suggérer une autre option pour ajouter des ensembles de données périodiques? – Rhea
Non, cependant votre première option me semble la mieux applicable. – zuluk