Le contenu du csv est la suivante:Comment extraire le contenu entre et Parenthèses (le cas échéant) dans une ligne de csv, en Python
"Washington-Arlington-Al, DC-VA-MD-WV (MSAD)" 47894 1976
"Grand-Forks, ND-MN" 24220 2006
"Abilene, TX" 10180 1977
La sortie requise est lu par le csv, trouver contenu entre "" dans la colonne 1 et aller chercher seulement DC-VA-MD-WV, ND-MN, TX et mettre ce contenu dans une nouvelle colonne. (Pour la normalisation)
Jusqu'ici essayé beaucoup de modèles regex en python, mais n'a pas pu obtenir le bon.
sample=""" "Washington-Arlington-Al, DC-VA-MD-WV (MSAD)",47894,1976
"Grand-Forks, ND-MN",24220,2006
"Abilene, TX",10180,1977 """
open('sample.csv','w').write(sample)
with open('sample.csv') as sample, open('output.csv','w') as output:
reader = csv.reader(sample)
writer = csv.writer(output)
for comsplit in row[0].split(','):
writer.writerow([ comsplit, row[1]])
print open('output.csv').read()
Résultat attendu est:
DC-VA-MD-WV
ND-MN
TX
dans une nouvelle ligne
N'aurait-il pas encore besoin d'un motif regex pour se diviser? (désolé joli nouveau à python) – Viv