2016-06-12 4 views
-1

Cela peut être une question assez basique, je suis nouveau dans la zone porc et python. J'essaye d'importer outputSchema de pigutil.Impossible d'importer outputSchema à partir de pigutil en python

Le outputSchema est utilisé comme suit dans l'UDF python: -

@outputSchema('HistorySchema:bag{t:(SomeKey:int,ScdColumnNew:chararray,ScdColumnOld:int, activeFlag:chararray, EndDate:int, ChangeDate:int)}') 

Je reçois ci-dessous erreur en essayant de courir et vérifier ligne de commande Python éditeur.

NameError: name 'outputSchema' is not defined 

Une fois importé en utilisant l'instruction

from pigutil import outputSchema 

Obtenir ci-dessous erreur: -

ImportError: No module named org.apache.pig 

Ce que je suis en train de réaliser ici est d'écrire une UDF qui renverrait 2 tuple d'un tuple unique en cochon. J'ai essayé l'approche d'utiliser deux différentes instructions de génération et ensuite faire l'union des deux, mais ses performances lourdes, donc aller pour l'UDF.

Répondre