J'ai travaillé avec l'ensemble de données sur les sentiments et constaté que les ensembles de données bing et nrc contiennent quelques mots qui ont à la fois un sentiment positif et un sentiment négatif.Mots tidytext avec sentiment positif et négatif
** bing - trois mots avec un sentiment positif et négatif **
env_test_bing_raw <- get_sentiments("bing") %>%
filter(word %in% c("envious", "enviously","enviousness"))
# A tibble: 6 x 2
word sentiment
<chr> <chr>
1 envious positive
2 envious negative
3 enviously positive
4 enviously negative
5 enviousness positive
6 enviousness negative
** nrc - 81 mots avec un sentiment positif et négatif **
test_nrc <- as.data.frame(
get_sentiments("nrc") %>%
filter(sentiment %in% c("positive","negative")) %>%
group_by(word) %>%
summarize(count = n()) %>%
filter(count > 1))
env_test_nrc <- get_sentiments("nrc") %>%
filter(sentiment %in% c("positive","negative")) %>%
filter(word %in% test_nrc$word)
# A tibble: 162 x 2
word sentiment
<chr> <chr>
1 abundance negative
2 abundance positive
3 armed negative
4 armed positive
5 balm negative
6 balm positive
7 boast negative
8 boast positive
9 boisterous negative
10 boisterous positive
# ... with 152 more rows
J'étais curieux de savoir si je fait quelque chose de mal ou comment un mot peut avoir des sentiments négatifs et positifs dans un ensemble de données source unique. Quelles sont les pratiques standard pour gérer ces situations?
Merci!