J'ai un système qui recueille des données de journal Apache en temps réel d'environ 90-100 serveurs Web. J'avais aussi défini quelques motifs d'URL.Quelle est la meilleure base de données/stockage pour stocker des données statistiques?
Maintenant je veux construire un autre système qui met à jour l'heure de l'occurrence de chaque modèle basé sur ces journaux.
j'avais pensé à utiliser MySQL pour stocker des données statistiques, les mettre à jour par la déclaration: "Mise à jour table
mis count
= count + 1 où ....",
mais je crains que MySQL sera lent pour les données d'un tel nombre de serveurs. De plus, je recherche des solutions de bases de données/de stockage plus évolutives et simples. (En tant que SGBDR, MySQL supporte trop de choses dont je n'ai pas besoin dans cette situation). Avez-vous une idée ?
Redis sera la solution parfaite car elle fournit des opérations d'incrémentation atomique pour protéger de la course conditions. Cassandra et Riak ne supportent pas cette fonctionnalité qui rendra difficile la mise à jour correcte des données. –