2017-07-28 11 views
-1

Ma question est de savoir s'il existe un moyen d'accéder à une relation 'data1' construite dans sript1.pig à partir de script2.pig sans avoir à charger à nouveau les données?Pouvons-nous accéder à une relation chargée dans le script A à partir du script B dans Apache pig?

script1.pig a:

data1 = LOAD '$some_location'USING PigStorage('\t') AS (...); 

RUN script2.pig; EXEC;

script2.pig a:

filter1 = FILTER data1 BY <<some-condition>>; 

Puis-je accéder à data1 script2.pig, sans avoir à recharger data1 dans script2.pig?

+0

J'apprécierais vraiment si quelqu'un peut fournir une solution alternative. – Saurabh

+0

Non .............. –

+0

Je pense que vous pouvez, s'il vous plaît jeter un oeil à ma solution et laissez-moi savoir si un problème ou si vous avez besoin de toute autre information de mon côté. – Saurabh

Répondre

0

Quelque chose que j'ai essayé dans mon projet pour le résoudre et cela a fonctionné:

runner_script.pig a:

RUN script1.pig; 
EXEC; 

RUN script2.pig; 
EXEC; 

script1.pig a:

data1 = LOAD '$some_location'USING PigStorage('\t') AS (...); 
filter1 = FILTER data1 BY <<some-condition-1>>; 

script2.pig a:

filter1 = FILTER data1 BY <<some-condition-2>>; 

Cela Comme je n'ai pas eu à charger le data1 deux fois.