Aster utilisateur ici qui essaie de passer complètement à python pour l'analyse de texte de base. J'essaie de reproduire la sortie de ASTER ngram en Python en utilisant nltk ou un autre module. Je dois être en mesure de le faire pour ngrams de 1 à 4. Sortie à csv.Python et nGrams
DATA:
Unique_ID, Text_Narrative
SORTIE Nécessaires:
Unique_id, ngram(token), ngram(frequency)
Exemple sortie:
- 023345 "I" 1
- 023345 "Love" 1
- 023345 "Python" 1
Salut, bienvenue à SO, pouvez-vous inclure du code de ce que vous avez essayé? Quel est le problème principal? –
Nous ne sommes pas un service de codage. S'il vous plaît montrez-nous ce que vous avez fait et où vous êtes coincé. –
vous avez besoin de deux choses - 'open' ou' csv.writer' pour l'écriture du fichier, alors je recommanderais 'Counter' de' collections' et c'est à peu près tout. Voulez-vous la fréquence dans la chaîne unique_ID ou tout à fait? –