Je fais l'analyse des sentiments de données Twitter dans r. Mais avoir plus de tweets répétés dans les données. affecte-t-il le résultat?dans l'analyse des sentiments de données Twitter, retweets répétés infulence le résultat?
RT @Ananduvi: Supporterez-vous #BharathBandh aujourd'hui contre #demonetization ???
RT @Ananduvi: Supporterez-vous #BharathBandh aujourd'hui contre #demonetization ???
si oui! alors comment y faire face? Je veux enlever ces tweets de l'ensemble de données de Twitter.
text<- gsub("(RT|via)((?:\\b\\W*@\\w+)+)", "", text)
Ce code supprime uniquement le nom de la personne mais le tweet reste tel quel.
Je serai heureux si vous m'aidez.
Certainement cela affectera le résultat. Nous pouvons vérifier l'identifiant du tweet associé à chaque tweet. Supprimer les ID en double. –