Je dois concevoir une base de données de trafic qui comprend des données de différentes villes (8 villes) 2mb dans une période de 10 min pour chaque ville 24h. Les données entrantes sont les mêmes pour toute la ville. Ma première question est donc de savoir ce qui est le mieux en matière de performance: concevoir une base de données pour toutes les villes avec plusieurs tables (une table pour chaque ville) ou concevoir de nombreuses bases de données (une base de données pour chaque ville)? Ma deuxième question est quel est le meilleur système de gestion de base de données pour ce scénario, MySQL, Postgres, Oracle ou autres?Meilleure solution de base de données pour la gestion d'une énorme quantité de données
Répondre
La quantité de données que vous recevez chaque jour est assez importante (~ 5 Go), mais le nombre de lignes insérées est plutôt faible. Par conséquent, vous devez concevoir votre modèle physique pour faciliter l'administration du stockage de base de données et l'interrogation efficace. Disposer d'une base de données séparée par ville n'a de sens que si vous avez un serveur par base de données. Mais vous n'avez pas besoin d'équilibrage de charge, car vous n'avez à gérer que huit insertions toutes les dix minutes. D'un autre côté, cette architecture transformera chaque requête qui compare une ville contre une autre en une requête distribuée. Avoir une table par ville dans la même base de données peut vous donner des avantages de performance si la majorité de vos requêtes sont limitées aux données d'une ville plutôt que de comparer des villes. Mais je ne voudrais pas mettre beaucoup d'argent là-dessus. Même si cela fonctionnait, cela pourrait rendre d'autres types de requêtes plus difficiles. Etant donné que les données sont les mêmes pour toutes les villes, mon option préférée serait une table avec une colonne de différenciation (TOWN_ID). Surtout si j'avais l'argent pour une licence Oracle avec l'option Partitionnement.
Différentes bases de données par ville peuvent être difficiles à maintenir, même avec des tables différentes. Cela pourrait être réalisable si vous n'avez jamais à comparer les villes, mais tôt ou tard je parierais devoir comparer les données de différentes villes.
Partitionner des données est la voie à suivre. La base de données Anty qui prend en charge le partitionnement de données telles qu'Oracle ou SQL Server fonctionnerait correctement. Je ne sais pas si Postgre ou Mysql supportent cela, vous devriez demander à quelqu'un de mieux connaître ces bases de données.
- 1. Question de conception de base de données: Comment gérer une énorme quantité de données dans Oracle?
- 2. Meilleure solution d'authentification pour serveur de base de données RESTful
- 3. Entrée d'une quantité variable de données dans une base de données avec la meilleure normalisation possible
- 4. Concept d'archivage d'une énorme base de données
- 5. Gestion des données de hiérarchie dans la base de données
- 6. Gestion de base de données
- 7. Création d'une énorme base de données Informix
- 8. Gestion de base de données
- 9. construire une base de données pour un énorme portail Web
- 10. La meilleure solution pour conserver les fichiers dans la base de données (Rails)
- 11. Meilleure approche pour le transfert de données de la base de données distante à la base de données locale
- 12. Solution de synchronisation de données?
- 13. Conception de base de données pour une très grande quantité de données
- 14. Meilleure pratique pour les transactions de base de données d'application
- 15. Meilleure façon de synchroniser la base de données client avec la base de données du serveur
- 16. Gestion de la mémoire lors de l'utilisation de la base de données sqlite dans l'iphone
- 17. ont besoin d'un moyen d'importer une grande quantité de données dans la base de données MySQL
- 18. dans le projet de base de données avec la meilleure solution pour l'accès à l'utilisation de la sécurité
- 19. Django Admin: Gestion de la base de données
- 20. énorme quantité de temps l'envoi de données avec suds et proxy
- 21. Meilleure structure de données pour les données de séries temporelles
- 22. Comment mesurer la quantité de données mégaoctets?
- 23. meilleure base de données pour un événement en temps réel l'analyse solution
- 24. Gestion des envois simultanés sur la base de données
- 25. gestion de la base de données de gestion de site Web de réseautage social
- 26. Meilleure option pour le magasin de données Google App Engine et la base de données externe?
- 27. Quelle est la meilleure solution pour le regroupement de connexions de bases de données en python?
- 28. grande quantité de données - quelle est la meilleure façon de les envoyer?
- 29. php utilisateurs de base de données mysql gestion des connexions
- 30. Méthodes de gestion de l'historique des données dans la base de données SQL Server 2008
Cela sera probablement fermé comme subjectif. Lorsque vous posez ce type de question, qui n'a pas de réponse «correcte», veuillez cocher la case «wiki de la communauté» lorsque vous écrivez la question. (Vous pouvez probablement encore revenir en arrière et faire cela maintenant.) –
une feuille de calcul Excel avec adodb.dll. ;-P –
quel est le budget de votre matériel? combien de temps allez-vous conserver les données? –