Dans k-means et KSOM (Kohonen's Self Organizing Map), lequel donne les meilleures performances de récupération? Et comment calculer cette performance?Performances de récupération pour k-means et KSOM
Répondre
Vous devez définir avec précision votre utilisation proposée. Il est très probable que deux méthodes alternatives représenteront un compromis, pour certaines utilisations, l'une sera plus rapide que l'autre, ou l'une donnera plus de précision que l'autre. C'est à peu près le défi avec tous les systèmes informatiques, les références publiées ne peuvent pas être transférées de manière fiable à des applications spécifiques, vous avez très souvent besoin de tester en utilisant vos propres données et habitudes d'utilisation.
Pire, vous constatez souvent que de très petits changements dans les demandes font des changements significatifs dans les performances réelles. J'ai donc peur que vous ayez besoin d'effectuer vos propres analyses et tests pour vos applications particulières.
Je pense que vous devriez mieux mettre en évidence votre utilisation (en termes de forme des données, le nombre d'éléments, et les priors, vous pouvez connaître les données avant d'exécuter des techniques de clustering). K-means est très léger et rapide algorithme, mais avec des inconvénients majeurs:
- Initialisation: de meilleurs résultats proviennent de centroïdes de cluster au hasard, que l'algorithme lui-même ne contient aucune règle « d'évitement des minima locaux ».
- Nombre de clusters: vous devez savoir à l'avance le nombre de clusters que vous allez mapper sur les données
- Aucune dépendance sur la "forme" des clusters: K-means vise à équilibrer la taille des partitions dans l'espace , et dans la mise en œuvre de la littérature, il n'y a aucun moyen (presque) de modifier le flux par rapport à d'autres paramètres (statistiques du second ordre, mesures de la compacité, etc.).
D'autre part, SOM (ou KSOM comme vous le nom) est principalement utilisé pour taxonomies ou pour les subdivisions dans des espaces avec des mesures fortes de remise en forme, et peuvent tirer profit des prieurs plus structurés que K-Means. Vous pouvez sélectionner votre propre fonction noyau pour imposer des contraintes sur la forme du réseau et de nombreuses autres pratiques avancées qui méritent d'être décrites plus que quelques lignes. Inconvénient: stage, pas aussi rapide que K-Means, inutilisable dans certains domaines (lorsque la fonction du noyau ne se rapproche pas bien de la dispersion des données locales).
Espérons que cela peut vous aider.
Oui, je sais que le temps d'entraînement de K-means est un peu plus rapide que SOM. SOM prend plus de temps de formation car il nécessite un grand nombre d'itérations pour exécuter l'algorithme. Que diriez-vous de la précision (précision et rappel)? Pouvons-nous utiliser la formule de mesure F dans la recherche d'information pour mesurer la précision de l'entraînement et des tests? F-mesure = 2. (Précision. Rappel)/(Précision + Rappel) –
Ce n'est pas une question de "formation". Vous n'avez pas à traîner K-Means, c'est une technique non supervisée. Au lieu de cela, vous devez choisir vos «a priori» lorsque vous traitez avec K-Means, et les a priori dépendent des données. Plusieurs exemples sont dans la littérature d'algorithmes en deux étapes: le premier pour estimer les a priori (et pour K-Means, aussi, le nombre de clusters) et le second pour réellement faire le calcul. Pour les mesures de ponctualité pour K-Means, vous avez des hypothèses trop faibles dans l'algorithme pour assurer la précision lors de l'itération. Je vous suggère de rechercher des mesures de compacité à faire après chaque étape d'itération. – ZZambia
- 1. Multiprocesseur et performances
- 2. performances Mysql et Count (*)
- 3. Variables d'application et performances?
- 4. Performances d'analyse Javascript et CSS
- 5. Performances SQL et chaînes MD5
- 6. Références croisées et récupération de place
- 7. Performances ASP.net et requêtes de compilation
- 8. récupération de mot de passe pour drupal
- 9. Linq et récupération clé primaire
- 10. Consommation et performances de la mémoire ObjectContext
- 11. Performances de réflexion pour Data Access Layer
- 12. Confusions de mode de récupération SQL Server et de récupération en bloc
- 13. Problème de performances Javascript pour Internet Explorer
- 14. Cadre compact dans WinCE et performances
- 15. PROCÉDURE STOCKÉE Calculs et améliorations des performances
- 16. IIS 7 Moniteur de fiabilité et de performances
- 17. Tables temporaires et performances SQL SELECT
- 18. Données hiérarchiques dans Linq - options et performances
- 19. Récupération de données
- 20. SQL Server 2005 Performances et espace blanc
- 21. Contextes mobiles pour la récupération d'informations
- 22. KVO - problème de récupération de l'objet du stockage et de l'affichage pour l'édition
- 23. Analyse comparative des performances pour Apache Nutch
- 24. WPF VirtualizingStackPanel pour des performances accrues
- 25. SharePoint - Publication et récupération automatiques de fichiers via VBScript
- 26. Performances de Linq to Objects et meilleure implémentation
- 27. Récupération du contact et du GUID de l'entreprise depuis ACT!
- 28. Astuces pour améliorer les performances de défilement de l'iPhone UITableView?
- 29. Récupération d'application
- 30. Performances C# pour serveur proxy (vs C++)
mmm, ajoutez le tag 'devoirs'? –