Je veux compter la fréquence des mots dans un texte littéraire "text.txt" sans compter les mots vides (à partir d'une liste appelée "stopwords.txt") en utilisant le terminal.Fréquence des mots sans mots vides utilisant egrep
cat text.txt | tr -sc 'A-Za-z' '\n' | tr 'A-Z' 'a-z' | egrep -vwFf stopwords.txt | sort | uniq -c
Pourquoi cela ne fonctionne-t-il pas et quel devrait être le bon script?
Remarque: la sortie doit être triée de basse fréquence à haute!
post-échantillon des fichiers de sortie d'entrée – 123
Sur mon ordinateur, votre 'egrep -vwFf' renvoie l'erreur:' grep: matchers conflictuels spécifiés'. Le simple fait de retirer le 'F'flag corrige ceci pour moi. – Aserre
@ Aserre c'est un bon point –