Comment les agrégateurs de nouvelles comme flipboard mettent leurs articles dans des catégories comme «politique», «business», etc ... J'ai cherché cela mais je ne trouve pas de résultats, j'imagine que cela pourrait être fait manuellement. .? des aliments est-il une base de données publique qui contient une liste de flux RSS par catégorie Sinon, comment est-ce accompliComment les agrégateurs de nouvelles RSS catégorisent-ils les données?
Répondre
Il peut être un processus complexe, en plusieurs étapes, mais en général:
Marquez les données dans des paragraphes, des phrases et des mots http://nlp.stanford.edu/software/tokenizer.shtml est un exemple d'outil qui peut accomplir ceci http://alias-i.com/lingpipe/ est un autre exemple
Une fois étiqueté, jetez des mots généraux non spécifiques (également appelés «mots d'arrêt»), tels que «a», «le», «ha», «lol», «omg», etc. Les tokenizers ont généralement des méthodes intégrées qui permettent de les identifier et de les éliminer.
Identifiez n-grammes (mots qui vont ensemble). Par exemple, les mots "Bay" et "Area" sont deux mots, mais ils sont souvent considérés comme un seul mot "Bay Area". Vous devrez identifier les entités comme celle-ci pour les classer correctement.
Regroupez les éléments restants par parties du discours. Cela peut être utile, par exemple, pour éliminer les verbes, les adverbes et n'utiliser que des noms et des adjectifs pour les classifications de vos catégories.
Enfin, découpez et découpez vos données par catégorie.
- 1. Nouvelles agrégateurs
- 2. comment autoriser les agrégateurs RSS à utiliser des flux disponibles uniquement pour les utilisateurs connectés?
- 3. RSS pour les nouvelles de Google Finance
- 4. Nouvelles flux API pour les nouvelles générales
- 5. Comment réaliser un rouleau de nouvelles RSS?
- 6. Comment analyser les flux rss nouvelles, en utilisant php et stocker dans la base de données
- 7. Google Nouvelles RSS Feed -
- 8. Détection de nouvelles entrées de flux RSS
- 9. Comment gérer les données RSS provenant de WordPress pour le module RSS de Joomla?
- 10. Comment fonctionnent les lecteurs RSS?
- 11. Bonne nouvelles RSS feed pour les nouvelles JavaFX et des ressources
- 12. Comment lire les flux RSS de l'URL rss?
- 13. load Paramètres agrégateurs de ressorts dynamiquement pour les tests
- 14. rss feed comment pousser de nouvelles informations à ce
- 15. Comment afficher les dernières nouvelles?
- 16. afficher NOUVELLES COMPLÈTES en utilisant ASP.NET RSS
- 17. comment générer des RSS pour les sites de nouvelles par programmation dans java/j2ee?
- 18. SQL Insérer les nouvelles lignes et les données de formatage
- 19. Comment sauvegarder les flux rss?
- 20. Est-ce que les agrégateurs de news analysent le client ou le serveur?
- 21. Comment puis-je récupérer les nouvelles données chronologiques de l'API?
- 22. Comment afficher la version rss d'un lien de nouvelles
- 23. Nouvelles RSS via l'API Graph « obsolète »
- 24. Comment traiter les fils de nouvelles TFL?
- 25. Y a-t-il de bons agrégateurs de nouvelles C#, .net?
- 26. classer aveuglément les nouvelles tendances dans les données entrantes
- 27. comment remplacer les données précédentes par de nouvelles données dans les tableaux
- 28. Comment analyser les données RSS-CB en utilisant C#?
- 29. Comment analyser les données d'encodage à partir du flux RSS?
- 30. excel ajouter de nouvelles données et pousser les anciennes données