2016-08-20 2 views
0

Je construis une base de données pour faire des études de ventes/études historiques sur une entreprise pour l'école et j'ai quelques questions concernant le format de base et l'organisation de la table. J'analyserai quotidiennement les données sur les ventes des vendeurs individuels ainsi que les statistiques à l'échelle de l'entreprise et les statistiques générales du marché. Il existe deux types de base de données, l'un pour l'entreprise/le marché en général et l'autre pour les vendeurs individuels. Les données de la société sont fondamentalement une série chronologique, intervalle quotidien, tandis que les données de vendeur sont actuellement fournies dans un seul csv pour chaque jour, et contenant les statistiques de ventes/personnelles pour chaque vendeur le jour donné.Choisir la bonne structure pour une base de données

Il semble assez clair que je veux avoir deux types de tables différents, l'un pour les données de l'entreprise/du marché dans une série de temps, et l'autre pour les données des vendeurs. Les données des vendeurs, cependant, pourraient prendre l'une des trois formes suivantes: soit il reste tel quel, dans différents tableaux, un pour chaque jour où la clé primaire est l'identifiant du vendeur, ou réorganisé en tableaux de temps pour chaque vendeur où le clé primaire est la date (comme ce serait le cas avec la société/données de marché), ou toutes les données du vendeur (tous les CSV pour chaque jour) sont combinées dans une grande table qui a une sorte de primaire composite avec date et saleperson-id.

Il existe environ 250 000 lignes de données de vendeurs et environ 5 000 lignes de données d'entreprise/de marché.

Mes questions sont deux:

D'abord, serait-il préférable de mettre cette étude dans une base de données de séries chronologiques étant donné que les données sont par nature dans un timeseries?

Deuxièmement, des options énumérées ci-dessus pour la disposition des données de vendeur qui est préférable et pourquoi?

Toutes les pensées sont très appréciées.

+0

Theer est pas appel à l'aide d'un spécial base de données de séries temporelles. La plupart des données transactionnelles sont des séries chronologiques, mais vous n'avez pas besoin d'une base de données spéciale. ** Ne pas ** créer une table par jour par vendeur. Mettez toutes les données dans une table de vendeur avec un champ de date. Maintenant, vous pouvez l'analyser sur n'importe quelle échelle de temps que vous voulez (semaines, mois, même semaine l'année dernière, etc.) ainsi que le faire correspondre aux données quotidiennes. Je peux garantir à 100% que vous ne devriez pas créer une table par jour –

Répondre

-1

Pas assez de données ici pour comprendre votre question. Peut-être essayer de partager une ligne de données CSV de chacune de vos tables d'entrée? Sur la base de ce que j'ai lu, il semble que vous vouliez une table pour le vendeur et une autre pour les données de performance sur l'ID du vendeur.

Créer tableau VENDEURS À (prenom varchar (50), last_name varchar (50), sales_ID int) Créer une table SalePerformance (sales_ID int, [date] date float sales_volume)