0
Quel devrait être de porc de script équivalent de la ci-dessous requête SQL:Comment Grouper par sur plusieurs colonnes dans un script de porc
SELECT fld1, fld2, fld3, SUM(fld4)
FROM Table1
GROUP BY fld1, fld2, fld3;
Pour Tableau 1:
A B C 2 X Y Z
A B C 3 X Y Z
A B D 2 X Y Z
A C D 2 X Y Z
A C D 2 X Y Z
A C D 2 X Y Z
SORTIE:
A B C 5
A B D 2
A C D 6
Merci :) ... il a travaillé Ce que je fini par est venu avec: A = charger 'input.csv' en utilisant PigStorage (',') AS (fld1: chararray, fld2: chararray, fld3: chararray, fld4: long, fld5: chararray, fld6: chararray, fld7 : chararray) ; groupe A = groupe A par (fld1, fld2, fld3); B = chaque groupe génère un groupe.fld1, groupe.fld2, groupe.fld3, somme (A.fld4) en tant que somme_fld4; DUMP B; – Saurabh