Nous explorons SPARK pour cassandra afin de surmonter les limitations avec CQL. Au début, nous étions limités à CQL, mais nous étions confrontés à quelques obstacles/obstacles par rapport au SGBDR. Pour ne citer que quelques-uns comme ci-dessousQuels sont les avantages supplémentaires offerts par Spark sur CQL?
- Pour comparer > (supérieur à) et < (Moins) sur une colonne, nous sommes limités à avoir les colonnes de clé Clustering. Même si j'ai une colonne dans Clustering, je devrais toujours fournir la clé de partition pour faire < ou> sur la clé de clustering.
- ne peut pas vérifier la valeur NULL sur une valeur de la colonne
- Pour interroger sur une colonne autre clé de la partition, il faut créer un index sur cette colonne
- ORDER BY d'une colonne qui n'est pas un REGROUPEMENT KEY
- GROUP BY limitations
- Rejoindre Tables
Je suis un débutant avec cassandra et finissent à revisiter mon schéma souvent en raison des limitations.
Par conséquent semblable à HIVE/PIG pour HDFS, quels avantages supplémentaires Spark donne sur CQL? CQL n'est pas un remplacement pour SQL.