2017-07-13 4 views
0

Je compare AWS Kinesis Analytics à PipelineDB en utilisant des données de "référence" dans STREAM SQL.Différences dans l'utilisation de données de référence par PipelineDB et AWS Kinesis Analytics

http://docs.aws.amazon.com/kinesisanalytics/latest/dev/limits.html http://docs.pipelinedb.com/joins.html#joins

Question 1: JOIN sur plusieurs tables de référence

AWS Kinesis Analytics - ne vous permet de joindre aux données de référence d'une source. Cela semble vraiment restrictif! À moins que je ne le comprenne pas. Je voudrais être en mesure de JOIN JOIN, UTILISATEURS, et une ADRESSE données de référence. Je ne peux pas?

PipelineDB - indique qu'il prend en charge JOINs, mais que les documents n'ont pas d'exemple JOIN pour plusieurs tables de référence. PipelineDB prend-il en charge la jonction de plusieurs tables de référence dans ses STREAMS et/ou VIEW CONTINUS?

Question 2: Les données de référence Rafraîchissant

AWS Kinesis Analytics - dit que vous devez sauter à travers quelques cerceaux (par exemple appeler des API AWS, etc.) pour actualiser les données de référence stockées dans son seau S3 pour le flux

PipelineDB - Les flux peuvent-ils simplement obtenir les dernières données de référence lors de leur mise à jour à l'aide de mises à jour SQL standard dans les tables de référence?

Can PipelineDB JOIN aux vues SQL régulières, donc, la vue SQL est mise à jour automatiquement chaque fois que les données sous-jacentes sont modifiées?

Répondre

0
  1. PipelineDB vous permet de JOIN sur autant de tables que vous le souhaitez, y compris avec d'autres vues en continu ou des vues réguliers. La seule chose que vous ne pouvez pas JOIN avec un flux est un autre flux (aucun flux-flux JOINs). Quelles que soient les "données de référence" à JOIN, le temps est ce qui sera utilisé pour mettre à jour la vue continue. En d'autres termes, la mise à jour des données de référence après le fait ne changera pas automatiquement les données historiques dans la vue continue, mais les nouvelles lignes entrantes refléteront les données de référence mises à jour.

Voici un exemple d'une définition de vue continue qui contient plusieurs JOINs:

https://github.com/pipelinedb/pipelinedb/blob/master/src/test/regress/sql/stream_table_join.sql#L61

+0

Parfait! Merci d'avoir clarifié Derek. Existe-t-il un exemple de publication de plusieurs JOINs dans 2+ tables de référence? Je ne pouvais pas trouver dans les documents ou des exemples actuels. – Jason

+0

Bien sûr, j'ai ajouté un lien vers un test avec un exemple. N'hésitez pas à nous contacter (Gittr est probablement le meilleur) si vous avez besoin d'aide pour construire votre CV, nous sommes heureux de vous aider. –