Je me demande comment obtenir le terme poids de fréquence dans tm packge qui est (tf = terme/termes totaux dans le document) `Comment puis-je configurer le poids des termes TF dans le corpus en utilisant le paquet 'tm' dans R
MyMatrix <- DocumentTermMatrix(a, control = list(weight= weightTf))
Après que j'utilise ce poids, il montre la fréquence du terme non TF poids comme celui-ci
Doc(1) 1 0 0 3 0 0 2
Doc(2) 0 0 0 0 0 0 0
Doc(3) 0 5 0 0 0 0 1
Doc(4) 0 0 0 2 2 0 0
Doc(5) 0 4 0 0 0 0 1
Doc(6) 5 0 0 0 1 0 0
Doc(7) 0 5 0 0 0 0 0
Doc(8) 0 0 0 1 0 0 7
Je sais que ce n'est pas le paquetage tm, mais j'aime utiliser le paquetage tidytext. 'bind_tf_idf' est la fonction que vous pouvez utiliser. Le blog suivant de l'auteur donne un bon aperçu sur le paquet http://juliasilge.com/blog/Life-Changing-Magic/ – PhiSeu
Vous utilisez l'option 'weighting' pas' weight' –
Possible duplicate of [Essayer d'obtenir tf-idf pondération fonctionnant dans R] (http://stackoverflow.com/questions/14820590/trying-to-get-tf-idf-weighting-working-in-r) –