Cela peut être une question assez basique, je suis nouveau dans la zone porc et python. J'essaye d'importer outputSchema de pigutil.Impossible d'importer outputSchema à partir de pigutil en python
Le outputSchema est utilisé comme suit dans l'UDF python: -
@outputSchema('HistorySchema:bag{t:(SomeKey:int,ScdColumnNew:chararray,ScdColumnOld:int, activeFlag:chararray, EndDate:int, ChangeDate:int)}')
Je reçois ci-dessous erreur en essayant de courir et vérifier ligne de commande Python éditeur.
NameError: name 'outputSchema' is not defined
Une fois importé en utilisant l'instruction
from pigutil import outputSchema
Obtenir ci-dessous erreur: -
ImportError: No module named org.apache.pig
Ce que je suis en train de réaliser ici est d'écrire une UDF qui renverrait 2 tuple d'un tuple unique en cochon. J'ai essayé l'approche d'utiliser deux différentes instructions de génération et ensuite faire l'union des deux, mais ses performances lourdes, donc aller pour l'UDF.