2016-06-18 2 views
6

J'ai travaillé sur l'agrégation de données en streaming, j'ai trouvé 2 outils pour atteindre le même. Ils sont druidiques et pipelinedb. J'ai compris la mise en œuvre et l'architecture des deux. Mais ne pouvait pas trouver un moyen de comparer ces deux. Y a-t-il un test de référence qui a été fait? Ou si je veux faire un benchmarking en dehors de la vitesse et de l'évolutivité, quels sont les facteurs que je dois considérer. Toutes les idées, les liens et l'aide seraient vraiment appréciables. Aussi ne partagez votre expérience avec pipelinedb et druideEn comparant druid et pipelinedb

Merci

+1

Avez-vous trouvé quelque chose? Vous cherchez la même chose. Avec quoi êtes-vous allé à la fin et pourquoi? –

Répondre

0

UPD:

Après avoir lu les pages PipelineDB, je ne me demande pourquoi avez-vous besoin de comparer ces différentes choses? Druid est assez complexe à installer et à maintenir, il nécessite plusieurs dépendances externes (telles que zookeeper et hdfs/amazon, qui doivent aussi être maintenues).

Et pour ce prix que vous achetez les principales caractéristiques de Druid: colonne orientée et distribués stockage et de traitement. Cela implique également un scalabitily horizontal, et c'est complètement automatique, vous n'avez même pas à y penser. Donc, si vous n'avez pas besoin de sa nature distribuée, je dirais que vous n'avez pas besoin de druide du tout.

VERSION PREMIER:

Je n'ai aucune expérience avec pipelinedb (qu'est-ce Google ne montre rien, pls partager un lien?), Mais j'ai beaucoup d'expérience avec Druid. Donc, je considère (en dehors de la vitesse et de l'évolutivité [requête]): (nombre de lignes par seconde/min/heure/... peut être inséré)

  1. ingérant performances
  2. la consommation RAM de ingérant (la quantité de RAM dont il a besoin d'ingérer une vitesse cible?)
  3. niveau de compression (combien d'espace disque a besoin d'une heure/jour/mois/... des données?)
  4. tolérance aux pannes (ce qui se passe lorsque certains des composants échouent? Il est critique pour mon entreprise?)
  5. Mise en cache (garder à l'esprit)
+0

Qu'est-ce que google utilisez-vous? pipelinedb est assez bien référencé. https://www.pipelinedb.com/ – mathieu

+0

hier, il a montré des tonnes de pages "acheter ce domaine" –