J'utilise python pour convertir les mots d'une phrase dans un fichier texte en jetons individuels dans une liste dans le but de compter des fréquences de mots. J'ai des problèmes pour convertir les différentes phrases en une seule liste. Voici ce que je fais:Conversion de phrases dans un fichier en jetons de mots dans une liste
f = open('music.txt', 'r')
sent = [word.lower().split() for word in f]
Cela me donne la liste suivante:
[['party', 'rock', 'is', 'in', 'the', 'house', 'tonight'],
['everybody', 'just', 'have', 'a', 'good', 'time'],...]
Depuis les phrases dans le fichier étaient en lignes distinctes, elle renvoie la liste des listes et defaultdict ne peut pas identifier la jetons individuels à compter.
a essayé la compréhension de la liste ci-dessous pour isoler les jetons dans les différentes listes et de les retourner à une liste unique, mais il retourne une liste vide à la place:
sent2 = [[w for w in word] for word in sent]
est-il un moyen de faire cette liste à l'aide compréhensions? Ou peut-être un autre moyen plus facile?
@Sven La solution de Marnach est bonne. Une solution générale au problème de vouloir dénier une liste imbriquée est l'utilisation de 'itertools.chain()'. Voir http://ideone.com/g4YMu –