1
J'ai le tableau suivant qui obtient des mises à jour incrémentielles. J'ai besoin d'écrire une requête Hive normale pour fusionner les lignes avec la même valeur de clé avec les valeurs les plus récentes.Fusion d'enregistrements en double sur la table Hive
Key | A | B | C | Timestamp
K1 | X | Null | Null | 2015-05-03
K1 | Null | Y | Z | 2015-05-02
K1 | Foo | Bar | Baz | 2015-05-01
Vous le voulez:
Key | A | B | C | Timestamp
K1 | X | Y | Z | 2015-05-03
Première pensée - coalescent, mais je ne pense pas que ce soit correct –
si la colonne sont moins vous pouvez essayer de la ruche ne supporte pas de nouveau appel CTE pour créer un nouveau CTE vous devez créer une nouvelle table ou dans le stockage de garniture. alors j'ai un peu de soln .. –