Nous sommes actuellement confrontés à un problème de stockage et de récupération efficaces de données à partir de très gros volumes de données (en milliards). Nous avons utilisé mysql et avons optimisé le système, le système d'exploitation, le raid, les requêtes, les index, etc., et nous cherchons maintenant à passer à autre chose.Comment stocker et interroger des ensembles de données très volumineux (au-delà des DB relationnels)
J'ai besoin de prendre une décision éclairée sur la technologie à suivre pour résoudre nos problèmes de données. J'ai étudié la carte/réduire avec HDFS, mais j'ai aussi entendu de bonnes choses à propos de HBase. Je ne peux pas m'empêcher de penser qu'il existe d'autres options. Y a-t-il une bonne comparaison des technologies disponibles et quels sont les compromis de chacun?
Si vous avez des liens à partager sur chacun, j'apprécierais aussi.