Je dois décider quel serveur de base de données utiliser pour mon prochain projet, mais la simple décision d'utiliser MySQL comme presque tous les projets que j'ai faits est plus difficile maintenant, parce que je m'attends à beaucoup d'enregistrements.Quelle base de données utiliser pour le stockage et la manipulation de gros volumes de données?
La base de données va stocker une liste d'utilisateurs, d'autres tables non pertinentes et la dernière, des données collectées par l'utilisateur. Disons, si j'ai 6000 utilisateurs répondant à un quiz sur l'autre. Des calculs simples montrent que de ces utilisateurs, si chacun répond au questionnaire sur tout le monde (et dans mon projet qui est sûr à 99%), je me retrouverai avec 35,99 millions d'enregistrements (ils s'excluront eux-mêmes et dans cette situation particulière l'opération est 6000 * 5999). Malheureusement 6000 est peut-être un petit nombre, le vrai nombre croissant jour après jour.
Que choisir? MySQL et peut-être si les choses vont bien et le projet se développe pour l'étendre dans un cluster? PostgreSQL, MSSQL? Oracle? J'ai lu à propos de chacun d'eux, chacun a ses avantages et ses inconvénients, mais je ne sais toujours pas quoi choisir. L'avantage de MySQL et PostgreSQL est bien sûr le prix de départ de 0 $, ce qui est plutôt bien dans une start-up habituelle autofinancée.
Un avis, des conseils? Si vous avez rencontré cette situation dans votre expérience en tant que développeurs, j'aimerais beaucoup avoir de vos nouvelles. 3500 millions d'enregistrements peuvent être facilement gérés par MS SQL Server (en supposant que la conception de la base de données, les index, etc. sont corrects).
Taille de la base de données 4 gig/36 millions de lignes = 119 octets par ligne - y compris les index. –