0
CASSANDRA_TABLE has (some_other_column, itemid) as primary key.
val cassandraRdd: CassandraTableScanRDD[CassandraRow] = sparkSession.sparkContext
.cassandraTable(cassandraKeyspace, cassandraTable)
cassandraRdd.take(10).foreach(println)
Cette cassandraRdd a toutes les colonnes lues à partir de ma table cassandraSpark CassandraTableScanRDD KeyBy ne conserve pas toutes les colonnes
val temp1: CassandraTableScanRDD[((String), CassandraRow)] = cassandraRdd
.select("itemid", "column2", "column3")
.keyBy[(String)]("itemid")
val temp2: CassandraTableScanRDD[((String), CassandraRow)] = cassandraRdd
.keyBy[(String)]("itemid")
temp1.take(10).foreach(println)
temp2.take(10).foreach(println)
Les deux temp1 et temp2 ne retenez pas toutes les colonnes après cette opération de keyBy
((988230014),CassandraRow{itemid: 988230014})
Comment puis-je keyBy sur certaines colonnes et avoir CassandraRow conserve toutes les colonnes?