J'ai un fichier CSV particulièrement mauvais. Bien que j'ai "résolu" le problème à la fin en écrivant manuellement des scripts pour traiter et retraiter ce fichier spécifique Je voulais savoir s'il y avait d'autres solutions là-bas.Traitement d'un fichier CSV mal formaté
Vous avez un fichier CSV dont tous les champs sont terminés par | caractères (pipe). L'exécution d'une vérification rapide vous montre qu'il y a 53 champs dans le fichier. La personne qui vous a remis le dossier dit qu'il n'y a que 28 champs. Tous les champs ne contiennent pas d'informations. Par exemple, il existe cinq champs custom_field_ {num} pouvant contenir ou non des données.
Comment voulez-vous obtenir dans une base de données bien?
La solution idéale (et celle que j'ai recherchée haut et bas pour) serait de tout jeter dans une table sans noms de colonnes ou de spécifications. Ensuite, supprimez toutes les colonnes qui étaient complètement vides, puis donnez-leur les titres et les spécifications.
Jetez un oeil à mon projet FOSS http://code.google.com/p/csvfix/ qui est un outil pour la fusion (et la validation) des fichiers CSV. Il traite également plusieurs types de données non-CSV et peut générer du code SQL à partir de CSV pour les mises à jour de base de données. –