Mon but est d'analyser certains corpus (Twitter pour l'instant) pour le contenu émotionnel. Juste aujourd'hui j'ai réalisé qu'il serait judicieux de chercher des mots plutôt que d'avoir une liste exhaustive de termes émotionnels. Et donc j'ai exploré nltk.stem seulement pour réaliser qu'il y a 4 stemmers différents. Je voudrais demander aux linguistes de stackoverflow si LancasterStemmer, PorterStemmer, RegexpStemmer, RSLPStemmer, ou WordNetStemmer est de préférence avec une certaine justification.Quel mot stemmer devrais-je utiliser dans nltk?
Répondre
RSLP est pour le portugais. Je suppose que tu veux l'anglais. Regexp vous demanderait de développer vos propres expressions souches, donc je pense que cela peut aussi être ignoré. Le WordnetStemmer exige que vous connaissiez la partie du discours pour le mot, de sorte que vous devez d'abord faire un tag pour l'utiliser. J'ai utilisé l'algorithme de stemming de porteur et c'est plutôt bon, mais l'algorithme lancaster est plus récent, donc ça pourrait être mieux. Vous pouvez essayer d'utiliser une combinaison de stemmers, où vous choisissez la tige la plus courte de chaque stemmer. Quoi qu'il en soit, la ligne de fond est que PorterStemmer est un bon choix par défaut.
Cela peut être un peu différent de ce que vous demandez, mais la bibliothèque Nodebox Lingustics contient une fonction is_emotive() qui semble vérifier les mots pour voir s'ils sont des hyponymes récursifs de certains mots émotionnels. De commonsense.py
ekman = ["anger", "disgust", "fear", "joy", "sadness", "surprise"]
other = ["emotion", "feeling", "expression"]
Pas égrappoir, mais une approche intéressante de vérifier.
- 1. Exemples pratiques d'utilisation de NLTK
- 2. Quel est l'équivalent d'un mot-clé «ami» dans C Sharp?
- 3. Quand utiliser le mot clé "static" dans la classe C++?
- 4. F # - Quel est le mot clé "it"?
- 5. Quel .Net Timer() utiliser
- 6. Quel éditeur WYSIWYM utiliser?
- 7. Quel pli dois-je utiliser dans VIM?
- 8. Ajout de mots à SQL Server Texte intégral Stemmer
- 9. Comment utiliser le mot-clé LIKE dans SQL?
- 10. Stubbing automatique dans le mot java. Que utiliser?
- 11. Pouvez-vous utiliser le mot-clé params dans un délégué?
- 12. C# Quand utiliser "Ce" Mot-clé
- 13. Quel type de données utiliser?
- 14. Quel est l'équivalent VB.NET du mot clé readonly C#?
- 15. Quel est le mot-clé réservé pour NaN en javascript?
- 16. Quel protocole utiliser pour l'authentification dans un service Web?
- 17. Quel utilitaire d'archivage devrais-je utiliser dans Ubuntu?
- 18. Comment déterminer quel modèle de processus dans VS2010 utiliser?
- 19. Quel outil puis-je utiliser pour analyser ViewState dans Asp.Net?
- 20. Comment dire à Java quel StringEscapeUtils.escapeXML() utiliser?
- 21. SQL Quand utiliser quel type de données
- 22. Nouveauté de WPF - Quel contrôle utiliser/démarrer?
- 23. Quel système de contrôle de version utiliser?
- 24. Quel CMS, script, etc. devrais-je utiliser?
- 25. Quel appid devrais-je utiliser avec netsh.exe?
- 26. Connexions WebPart sur Sharepoint. - Quel type utiliser?
- 27. WPF Quel contenant dois-je utiliser
- 28. Quel réacteur dois-je utiliser pour qt4?
- 29. Comment utiliser un mot clé C# comme nom de propriété?
- 30. mot clé en haut dans Oracle 9i