J'ai beaucoup de fichiers journaux gzip dans d3 qui ont 3 types de lignes de journal: b, c, i. i et c sont tous les deux json à un seul niveau:Comment analyser JSON dans Pig?
{"this":"that","test":"4"}
Le type b est json profondément imbriqué. Je suis tombé sur ce gist en parlant de compiler un pot pour faire ce travail. Depuis que mes compétences en java sont moins que stellaires, je ne savais pas vraiment quoi faire à partir d'ici.
{"this":{"foo":"bar","baz":{"test":"me"},"total":"5"}}
Puisque les types i et c ne sont pas toujours dans le même ordre, ce qui rend tout en spécifiant dans le générer regex difficile. La gestion de JSON (dans un fichier gzip'd) est-elle possible avec Pig? J'utilise n'importe quelle version de Pig est construite sur une instance de Amazon Elastic Map Reduce.
Cela se résume à deux questions: 1) Puis-je analyser JSON avec Pig (et si oui, comment)? 2) Si je peux analyser JSON (à partir d'un fichier journal gzip), puis-je analyser des objets JSON imbriqués?
"Erreur lors de l'établissement d'une connexion à la base de données" sur le lien – andreban