J'ai beaucoup de mal à extraire des données de cochon et dans un fichier CSV que je peux utiliser en Excel ou SQL (ou R ou SPSS etc etc) sans beaucoup de manipulation ...Export de cochon vers CSV
J'ai essayé d'utiliser la fonction suivante:
STORE pig_object INTO '/Users/Name/Folder/pig_object.csv'
USING CSVExcelStorage(',','NO_MULTILINE','WINDOWS');
Il crée le dossier avec ce nom avec beaucoup de fichiers # 0000-partie-m. Je peux les rejoindre plus tard en utilisant cat part *> filename.csv mais il n'y a pas d'en-tête ce qui signifie que je dois le mettre manuellement. J'ai lu que PigStorageSchema est censé créer un autre bit avec un en-tête mais cela ne semble pas fonctionner du tout, par exemple, j'obtiens le même résultat que s'il est simplement stocké, pas de fichier d'en-tête: STORE pig_object INTO '/ Users/Name/Folder/pig_object' UTILISATION D'org.apache.pig.piggybank.storage.PigStorageSchema(); (J'ai essayé ceci en mode local et en mode mapreduce).
Existe-t-il un moyen d'extraire les données de Pig dans un simple fichier CSV sans ces étapes multiples?
Toute aide serait grandement appréciée!
Merci beaucoup pour votre aide, Lorand. Appeler les commandes du shell nettoie un peu les choses. Toutefois, l'argument -schema ne crée pas les fichiers .pig_header ou .pig_schema lorsque je l'exécute. J'ai essayé d'utiliser PigStorage et PigStorageSchema. Je cours le cochon 0.10.0. – Saxivore
Salut mate, à côté de ça ... le fichier .pig_header _is_ a été créé mais il était caché et je ne pouvais pas le voir (je m'habitue toujours à travailler avec des trucs shell). Donc, j'ai une solution de contournement qui peut être faite dans un script qui est génial. Merci! – Saxivore
@Saxivore Vérifiez le schéma de 'pig_object.' S'il n'y en a pas, aucun fichier d'en-tête et de schéma ne sera créé. Avez-vous besoin d'aide supplémentaire pour cette question? –