Je suis un débutant dans R. J'ai essayé de lire un fichier CSV comme celui-ci.Lire un fichier CSV et le marquer.
tweets <- read.csv("tweets.csv")
et je dois être en mesure de supprimer tous les ponctuations, convertir en minuscules, supprimer les numéros & mots d'arrêt & espaces blancs de la « tweets » trame de données sans avoir à le convertir en un corpus ou quelque chose. Rien d'extraordinaire juste en l'enlevant. Y a-t-il une bibliothèque/fonction qui pourrait aider à résoudre ce problème?
lecture d'un fichier CSV, puis le traitement/nettoyage, il y a différentes étapes. Je suggère de diviser ceci en deux questions, une pour lire le fichier CSV si cela vous donne des problèmes (s'il vous plaît partager des messages d'erreur, et peut-être un échantillon du fichier) et une autre question sur le nettoyage (encore une fois ce que vous avez essayé). – Gregor
Si vous avez lu le fichier CSV avec succès, ne le mentionnez plus, dites simplement "J'ai un cadre de données que je dois nettoyer". Mais montre encore ce que tu as essayé. En recherchant la balise R pour ["supprimer la ponctuation" (cliquez pour le lien)] (https://stackoverflow.com/search?q=%5Br%5D+remove+punctuation) et en essayant certains de ce que vous trouvez serait un bon début . Les requêtes d'outil/paquet/bibliothèque sont hors sujet. – Gregor
J'ai essayé mais je ne travaille pas. La plupart des autres fonctions que je trouve en ligne font également la même chose. tw [] <- lapply (tw, fonction (x) { if (is.list (x)) { lapply (x, fonction (y) { tolower (gsub ("[.,]", "", y)) }) } else { tolower (gsub ("[.,]", "", x)) } }) tw Je reçois ceci: $ tolower.as.matrix.tw .. [1] "" "" –