Je suis en train de lire la colonne « Transcription texte » à partir d'un fichier CSV qui ressemble à ceci -python-cant lire toutes les lignes d'un csv
Order,LearningID,Gender,Race,College, ID ,B,Transcript Text
1,T66666666B,Male,UNKNOWN,AMC,122333444,,(BEGIN INTERVIEW)
6,T77777777B,Male,UNKNOWN,AMC,133333333,,INTERVIEWER: CTVA's your major?
7,T88888888B,Male,UNKNOWN,AMC,144444444,,"STUDENT: Yes, that's right."
Et mon code à lire la colonne no. 7 (texte Transcript) ressemble à ceci -
import csv
file_csv = open("test.csv", newline='')
csv_reader = csv.reader(file_csv, delimiter=',', quotechar='|')
txt_string =''
common_words = ['mmhmm', 'interposing', 'xblank']
for i, v in enumerate(csv_reader):
print (i)
print(v[7])
txt_string += v[7]
file_csv.close()
Maintenant, quand je boucle à travers cela, il saute certaines valeurs, toutes les valeurs pour v [7] (colonne - texte de transcription) sont imprimés. Curieusement, les valeurs des compteurs ne s'impriment pas aussi bien.
La sortie ressemble à ceci -
0
Transcript Text
3
STUDENT: Yes, that's right.
Je me suis assuré que le csv est enregistré en utilisant l'option utf-8 MS Excel, j'ai essayé de placer le codage utf-8 ainsi.
file_csv = open("test.csv", newline='', encoding ='utf-8')
Mais rien ne fonctionne. Et aussi très bizarrement, chaque fois que je lance ceci, les résultats sont erratiques, c'est-à-dire que certaines lignes qui n'ont pas été imprimées auparavant sont imprimées.
Quel pourrait être le problème ici? .. (en utilisant Python 3.5 et le fichier csv réel j'utilise a environ 25k lignes
Quel système d'exploitation utilisez-vous? –
Pouvez-vous montrer d'abord 2-3 lignes de votre fichier CSV. –
J'utilise Windows 7 – sandunes90