2009-10-06 7 views
1

Quel type d'algorithme serait bon de regrouper et de classer les blogs dans les communautés logiques (technologie, divertissement, etc ...)?Cluster et classer les blogs par catégories logiques

Un algorithme pour classer et classer les articles de blog serait encore meilleur.

Les réponses acceptées sont des algorithmes, du pseudo-code, du code java ou des liens vers des explications sur des algorithmes particuliers.

Mise à jour: Donc, il semble que je voudrais quelque chose dans la catégorie des Partional Clustering base, la plupart du temps, sur les caractéristiques textuelles.

Répondre

1

D'abord, vous devez définir votre problème mieux en définissant un:

  1. vecteur caractéristique (un descripteur) pour chaque blog
  2. Une métrique pour évaluer la « distance » entre les descripteurs.

Une fois que vous avez fait cela, vous avez un camion plein de clustering algorithms à choisir, comme kmeans, etc.

+0

Comment choisir les caractéristiques? – elhoim

Questions connexes