J'ai un problème de quantité de données qui nécessite beaucoup de manipulation de données et de massage et je mets cela en place pour voir si quelqu'un a une idée sur la façon de l'aborder.Meilleure approche pour traiter le problème des données SQL
Dans la forme la plus simple. J'ai beaucoup de tables qui peuvent être jointes ensemble pour me donner une liste de prix pour les dentistes et combien chaque charge pour une procédure. Nous avons donc plusieurs tables qui ressemblent à ceci.
Dentist | Procedure1 | Procedure2 | Procedure3 | .........| Procedure?
John | 500 | 342 | 434 | .........| 843
Dave | 343 | 434 | 322 | NULLs....|
Mary | 500 | 342 | 434 | .........| 843
Linda | 500 | 342 | Null | .........| 843
Les dentistes peuvent avoir un nombre différent de procédures et des prix différents pour chaque procédure. Mais il y a beaucoup de dentistes qui ont le même nombre de procédures et les mêmes taux qui vont avec. En interne, nous créons un identifiant unique pour chacune de ces listes de frais. Comme John serait 001, Dave serait 002, mais Mary serait 001 et Linda serait 003 Ce n'est pas si mal si je dois faire face à ces données une seule fois, mais ces listes de frais est en fichiers plats (csvs) que j'ai essentiellement à DTS jusqu'à un serveur SQL pour travailler avec. et ils viennent sur des bases mensuelles. Le prix pourrait changer de mois en mois pour chaque dentiste qui les mettrait alors dans un ID unique différent en interne. Quelqu'un peut-il nous éclairer sur la meilleure façon d'aborder ce problème de sorte qu'il soit plus efficace de traiter tous les mois sans avoir à manipuler des tonnes de données?
- Quelle est la meilleure approche pour trouver les doublons des listes de frais?
- Comment puis-je suivre la mise à jour de la liste des honoraires d'un dentiste, au cas où ils changeraient leurs tarifs le mois prochain? si Mary décide de facturer des frais différents pour la procédure 2, elle aura une identité unique différente en interne. Comment puis-je suivre cela sur une base mensuelle sans avoir à tout effacer et réinsérer?
- Il ya quelques millions de listes de frais que je travaille avec et certaines ont des règles standard qui sont basées sur les codes postaux et certains sont juste des listes de frais uniques, quelle est l'approche ici?
- Je peux écrire une sorte de programme .net ad-hoc pour travailler avec mais il y a beaucoup de données et travailler directement dans le serveur SQL serait plus facile pour moi.
toute aide serait super, merci les gars.
Malheureusement, nous avons créé des ID uniques internes pour ces listes de frais. Donc, si un médecin partage les mêmes listes de frais, ils auront le même ID unique interne. c'était une tentative ratée de normalisation. mais c'est pour des cas individuels. maintenant nous avons des listes de frais régionaux qui sont basés sur les codes postaux. Maintenant, si ces frais modifient les listes, il n'y a vraiment aucun moyen de les suivre parce que les mêmes zips peuvent avoir différentes listes de frais selon le type de listes de frais. – stevenjmyu
@megatoast, Dans ce cas, mon programme de code postal devrait avoir une clé unique sur ZipCode, FeeType, EffectiveDate –