J'essaye de charger un fichier CSV en utilisant Pig
, mais le fichier CSV contient déjà des 'virgules' dans certaines colonnes, donc utiliser PigStorage (',') me donne de mauvaises réponses.Charger CSV en utilisant Pig
Je l'ai déjà essayé ces:
REGISTER /......./piggybank.jar
LOAD '...PATH_TO_INPUT_FILE' USING CSVLoader(',') AS (...fieldnames)
et
LOAD '...PATH_TO_INPUT_FILE' USING CSVExcelStorage(',') AS (...fieldnames)
Les deux tous sont ne pas donner le résultat souhaité. L'enregistrement qui ne contient pas de virgule dans leurs valeurs fonctionne correctement mais le reste ne le sont pas.
Pouvez-vous envoyer quelques lignes d'entrée de l'ensemble de données que vous essayez de traiter? – CodeReaper
Vous avez donc un fichier CSV avec des valeurs séparées par des virgules, mais certaines des valeurs contiennent des virgules et ne sont pas échappées d'aucune façon? Si c'est le cas, vous êtes en difficulté ... – LiMuBei