tm - VoidCC

tm

0La chaleur

1Répondre

Comment ajouter itérativement à une liste de corpus tout en conservant son type dans R?

J'ai une liste de n documents que j'essaie de parcourir pour les ajouter ensemble afin qu'ils forment un seul VCorpus. Normalement, vous pouvez utiliser l'opérateur c() et joindre deux VCorpus pour en

0La chaleur

1Répondre

Problèmes d'encodage avec wordcloud et text mining

J'essaye d'implémenter un wordcloud de posts d'une page Facebook, en italien. Je suis capable de bien développer le wordcloud mais j'ai du mal à restituer des caractères particuliers typiquement itali

1La chaleur

1Répondre

Conversion de fichiers pdf en data.frames

J'essaye actuellement de créer une fonction qui va lire beaucoup de fichiers pdf dans une trame de données. Mon but ultime est de lire des informations spécifiques des fichiers pdf et de les convertir

0La chaleur

2Répondre

R tm TermDocumetMatrix ne montrera pas tout

Lorsque j'utilise TM, j'essaie d'afficher le TermDocumentMatrix avec inspect(), le résultat n'est pas tout la matrice, juste une partie de celui-ci. Je suis vraiment confus. Voici le résultat de mon T

1La chaleur

1Répondre

R: package wordcloud en omettant les mots de moins de trois caractères du corpus

Lors de la création d'un wordcloud en utilisant le package wordcloud, il semble que le paquet par défaut d'omettre des mots en dessous de trois caractères (tels que "tv"). Je pense que c'est une fonct

0La chaleur

1Répondre

Comment transformer le contenu du corpus en vecteur après newline "\ n"

Lorsque j'essaie d'utiliser strsplit en texte brut, il a la propriété désirée que la valeur stockée soit transformée d'une chaîne de caractères en un vecteur avec des chaînes de caractères . Par exemp

0La chaleur

1Répondre

une liste de plusieurs listes de 2 pour synonymes

Je veux lire les synonymes d'un fichier csv, où le premier mot est le mot « principal » et le reste des mots dans le même enregistrement sont ses synonymes maintenant je veux essentiellement créer une

0La chaleur

1Répondre

Problèmes avec le paquet tm de R

J'ai essayé de suivre un tutoriel Udemy, en utilisant le paquetage tm dans R pour faire du text mining sur les tweets. Jusqu'à présent, la plupart des fonctions spécifiées dans le tutoriel (et dans le

1La chaleur

1Répondre

Stemcompletion in R

Je travaille sur l'exploration de texte dans R, voici quelques documents de mon corpus, après suppression de la ponctuation, des nombres, des URL et des mots vides. myStopwords <- setdiff(myStopwords,

0La chaleur

1Répondre

Nouvelles données avec R et tm lorsque tf-idf est utilisé

En utilisant R et tm, j'ai chargé et nettoyé un tas de documents de texte, et j'en ai fait un corpus. Après cela, j'ai construit leur DTM en utilisant tf-idf, et que je peux utiliser pour tous les typ