tm

    0La chaleur

    1Répondre

    J'ai une liste de n documents que j'essaie de parcourir pour les ajouter ensemble afin qu'ils forment un seul VCorpus. Normalement, vous pouvez utiliser l'opérateur c() et joindre deux VCorpus pour en

    0La chaleur

    1Répondre

    J'essaye d'implémenter un wordcloud de posts d'une page Facebook, en italien. Je suis capable de bien développer le wordcloud mais j'ai du mal à restituer des caractères particuliers typiquement itali

    1La chaleur

    1Répondre

    J'essaye actuellement de créer une fonction qui va lire beaucoup de fichiers pdf dans une trame de données. Mon but ultime est de lire des informations spécifiques des fichiers pdf et de les convertir

    0La chaleur

    2Répondre

    Lorsque j'utilise TM, j'essaie d'afficher le TermDocumentMatrix avec inspect(), le résultat n'est pas tout la matrice, juste une partie de celui-ci. Je suis vraiment confus. Voici le résultat de mon T

    1La chaleur

    1Répondre

    Lors de la création d'un wordcloud en utilisant le package wordcloud, il semble que le paquet par défaut d'omettre des mots en dessous de trois caractères (tels que "tv"). Je pense que c'est une fonct

    0La chaleur

    1Répondre

    Lorsque j'essaie d'utiliser strsplit en texte brut, il a la propriété désirée que la valeur stockée soit transformée d'une chaîne de caractères en un vecteur avec des chaînes de caractères . Par exemp

    0La chaleur

    1Répondre

    Je veux lire les synonymes d'un fichier csv, où le premier mot est le mot « principal » et le reste des mots dans le même enregistrement sont ses synonymes maintenant je veux essentiellement créer une

    0La chaleur

    1Répondre

    J'ai essayé de suivre un tutoriel Udemy, en utilisant le paquetage tm dans R pour faire du text mining sur les tweets. Jusqu'à présent, la plupart des fonctions spécifiées dans le tutoriel (et dans le

    1La chaleur

    1Répondre

    Je travaille sur l'exploration de texte dans R, voici quelques documents de mon corpus, après suppression de la ponctuation, des nombres, des URL et des mots vides. myStopwords <- setdiff(myStopwords,

    0La chaleur

    1Répondre

    En utilisant R et tm, j'ai chargé et nettoyé un tas de documents de texte, et j'en ai fait un corpus. Après cela, j'ai construit leur DTM en utilisant tf-idf, et que je peux utiliser pour tous les typ