2017-06-21 10 views

Répondre

0

Ref: https://pig.apache.org/docs/r0.11.1/basic.html#GROUP, vous pouvez trouver un exemple multi-groupe

Pour votre usecase ci-dessous le code devrait être suffisant

A = load 'input.csv' using PigStorage(',') AS (fld1:chararray,fld2:chararray,fld3:chararray,fld4:long,fld5:chararray,fld6:chararray,fld7:chararray); 
B = FOREACH(GROUP A BY (fld1,fld2,fld3)) GENERATE FLATTEN(group) AS (fld1,fld2,fld3), SUM(A.fld4) AS fld4_aggr; 
DUMP B; 
+0

Merci :) ... il a travaillé Ce que je fini par est venu avec: A = charger 'input.csv' en utilisant PigStorage (',') AS (fld1: chararray, fld2: chararray, fld3: chararray, fld4: long, fld5: chararray, fld6: chararray, fld7 : chararray) ; groupe A = groupe A par (fld1, fld2, fld3); B = chaque groupe génère un groupe.fld1, groupe.fld2, groupe.fld3, somme (A.fld4) en tant que somme_fld4; DUMP B; – Saurabh