2014-05-21 1 views
0

J'ai créé un certain nombre de documents à différents moments. Je veux temporairement cluster ces documents.Mise en grappe de documents à l'heure

, c'est-à-dire Je souhaite regrouper les documents en groupes de documents avec des horodatages associés. Par exemple, s'il y a un "pic" dans le nombre de documents créés à l'heure X, ils seront groupés dans le même groupe et ainsi de suite ...

Supposons que nous ne connaissions pas le nombre de clusters possible.

+2

Google « détection éclatement », « détection de pic », « détection de crête ». Le fait que vous regardiez des documents est largement hors de propos, il suffit de les voir comme des événements ponctuels. –

Répondre

1

Si vous ne savez pas combien de clusters ont, la croissance du gaz Newral est un bon algorithme pour commencer. Vous pouvez jouer avec des démos ici: http://www.demogng.de/

Dans votre tâche, vous avez besoin de cas 1D.

Vous pouvez trouver une des implémentations ici: https://github.com/BelBES/libGNG

Questions connexes