2017-08-05 11 views
0

J'ai un code simple chez le porc, je veux extraire le nombre de films pour chaque année, je charge le contenu du fichier dans les films et je tapé ce code:extraire la liste des films différents pour chaque année en utilisant Pig

groupingyear = group movies by year; 
vrar = foreach groupingyear generate movies.year, COUNT(movies.year); 

Le résultat est bon! Mais je veux obtenir la (année, le nombre de films) structure et non cette structure: (pourquoi les années sont écrits plusieurs fois)

enter image description here

Répondre

1

Vous comptez le years.Assuming vous un MOVIE_NAME sur le terrain dans votre jeu de données de films.

groupingyear = group movies by year; 
vrar = foreach groupingyear generate group, COUNT(movies.movie_name);