Je suis nouveau à pigscript. Je suis coincé en travaillant sur l'exemple ci-dessous. Quelqu'un pourrait-il m'aider sur la façon d'obtenir la sortie spécifiée ci-dessous en utilisant pigscript?Mise en œuvre de logique Pigscript
Entrée:
1|ABC|NC
1|DEF|NC
2|CFD|NY
2|CGF|NY
Sortie:
1|ABC,DEF|NC
2|CFD,CGF|NY
Script:
A = LOAD 'testfile.txt' USING PigStorage('|') AS (Id:chararray,name:chararray,state:chararray);
B = FOREACH A GENERATE Id,name;
C = FOREACH A GENERATE Id,name,state;
C = DISTINCT C;
GROUPED = GROUP B BY Id;
D = FOREACH GROUPED GENERATE group AS Id,c.name AS name_val;
E = JOIN D BY Id, C BY Id;
X = FOREACH E GENERATE D.Id as docid,D.name_val as termid,C.state;
Dump X;
Où est votre pigscript œuvre 'différents scénarios'? –