0

Je souhaite traiter les journaux d'accès créés par Amazon CloudFront avec Amazon Elastic MapReduce. J'ai juste besoin de quelques statistiques simples sur combien de fois différents fichiers ont été chargés à partir de cloudfront, donc je pensais que je devrais écrire un simple script PIG pour cela.Traitement de CloudFront-logs avec Elastic MapReduce (PIG) ​​

Le premier problème que j'ai est que cloudfront écrire les journaux gzippés et autant que je sais que je ne peux pas lire. GZ dans le cochon?

Des suggestions sur comment je devrais faire ceci? Je suis très novice en ce qui concerne le mapreduce élastique, donc je ne suis pas d'accord sur la façon de structurer ce genre de travail.

Répondre

2

Désolé, cela fonctionne par défaut. Pas besoin de décompresser les journaux avant de les traiter. Ma faute.

0

Vous pourriez être intéressé par Qloudstat. Nous offrirons des statistiques sur les journaux d'accès CloudFront en tant que service.

Questions connexes