2017-08-03 15 views
-1

Considérons les deux lignes de données CSV suivantes:Nettoyage de données avec Pig

01-15-2014 12:04:05, row1 
2014/02/20, row2 

rang 1 a le format d'horodatage souhaitée DD-MM-YYYY HH: MM: SS. L'horodatage de la ligne 2 doit être transformé pour correspondre. Alors, comment puis-je accomplir cette tâche?

Répondre

0

En supposant que vous avez les données chargées de dire relation A, puis passer la colonne avec la date en fonction ToDate avec le format.Note souhaité que la date devrait être chargée dans un champ chararray par rapport A.

B = FOREACH A GENERATE ToDate(A.$0,'MM-dd-yyyy HH:mm:ss'); 
+0

Le code ci-dessus ne fonctionne pas. – iamdeep

+0

@iamdeep Postez votre script. –

+0

Le code en cours s'exécute sans erreur, mais lorsque je vide la relation, rien n'est affiché comme résultat. – iamdeep