J'ai récupéré Twitter tweets pour différents hashtags avec différentes période de suivi. Par exemple, hashtag1 a été suivi pendant 6 jours, Hashtag2 suivi pendant 4 jours, Hashtag3 suivi pendant 2 jours. Comment puis-je normaliser chaque hashtag? Comment puis-je les diviser en quartiers égaux? Merci d'avance ... Voici le code ......>Comment normaliser les tweets dans l'histogramme en utilisant le langage R?
library(streamR)
library(rjson)
setwd("/Users/Desktop")
Tweets = parseTweets("Hashtag1.json")
table(Tweets$created_at)
dated_Tweets <- as.POSIXct(Tweets$created_at, format = "%a %b %d %H:%M:%S
+0000 %Y")
hist(dated_Tweets, breaks="hours", freq=TRUE, xlab="dated_Tweets", main=
"Distribution of tweets", col="blue")
Pouvez-vous nous montrer ce que vous obtenez en ce moment, et expliquer ce que vous êtes pas satisfait exactement? Voulez-vous quelque chose comme _tweets par jour_ pour chacun des hashtags? –
Oui, j'ai visualisé l'histogramme pour chaque hashtag, mais chaque hashtag a une période de suivi différente, donc je veux normaliser chaque hashtag. Par exemple, je veux diviser chaque jour qui est de 24 heures en 4 trimestres (toutes les 6 heures) puis accumuler tous les jours ensemble au même histogramme. – user3643380
Vous avez donc l'horodatage du tweet. Vous voulez créer un histogramme de "quarts de jour" pour chaque tweet? Vous voulez voir si # 2 est tweeté plus, disons dans les heures du matin, et # 4 la nuit? –