J'essaie d'utiliser le tidyverse (http://tidyverse.org/) pour analyser une liste de phrases en allemand. Je m'en tiens à ce guide (http://tidytextmining.com/). Lorsque j'essaie d'utiliser une liste de mots-clés en allemand, cela ne fonctionne tout simplement pas.R: Utiliser les mots d'arrêt allemands dans tidyverse mais anti_join ne fonctionne pas
library(tidyverse)
library(readxl) # read excel
library(tibble) # tobble dataframe
library(dplyr) # piping
library(stringr) # character manipulation
library(tidytext)
library(tokenizers)
data <- read_xlsx("C:/R/npsfeedback.xlsx", sheet = "Tabelle1", col_names="feedback")
data
is.tibble(data)
# tokenise
data_clean <- data %>%
na.omit() %>%
unnest_tokens(word,feedback)
Cela lui de la part me causer des ennuis:
# remove stopwords
sw <- tibble(stopwords("de"))
sw
data_clean <- data_clean %>%
anti_join(.,sw)
Mes topwords sont en Tibble avec une colonne et le type de caractères. Mais si j'essaie d'utiliser anti_join je reçois cette sortie:
Error: `by` required, because the data sources have no common variables
Savez-vous ce que je dois faire?