2017-09-16 17 views

Répondre

0

Vous pouvez y parvenir en utilisant deux jointures et union. Charger les deux ensembles de données dans les relations A et B.Créer une nouvelle relation C en joignant la première condition ta = tab.w.Créer une nouvelle relation D en rejoignant la deuxième condition tb = tab.x.UNION C AND D. En supposant que tous les types de données sont int.

A = LOAD 'data1.txt' USING PigStorage(',') AS (a:int,b:int,c:int,d:int); 
B = LOAD 'data2.txt' USING PigStorage(',') AS (w:int,x:int,y:int,z:int); 
C = JOIN A BY A.a,B BY B.w; 
D = JOIN A BY A.b,B BY B.x; 
E = UNION C,D; 
DUMP E;