J'ai construit un algorithme de filtrage collaboratif (cosinus, item-item) pour révéler les relations entre les éléments. En fin de compte mes données de résultat ressemble à ceci,Outil de grappage de graphe
itemNo relatedItemNo similarityValue
1546301 1543903 0.10767638
1546301 1530836 0.093250481
1546301 1479721 0.10767638
1557616 1573636 0.121267813
1557616 1558024 0.161690417
1086551 1437760 0.127000127
1086551 1552321 0.083333333
1086551 1578137 0.127000127
1086551 1560842 0.081110711
....... ....... ...........
Maintenant, je veux faire du clustering avec. En utilisant les valeurs de similarité entre les éléments, je veux obtenir des clusters en disant 1546301, 1479721, 1543903 est dans le groupe A; 1086551,1552321, 1560842 est dans le cluster B.
Comment puis-je gérer cela? Im nouveau à l'exploration de données est donc difficile à utiliser, même des outils simples.
J'ai appris que cela s'appelle Graph Clustering et j'ai téléchargé igraph pour r, installez cluto et essayez quelques étapes mais je n'ai même pas compris le format de données d'entrée d'entre eux.
Pouvez-vous me montrer le chemin? :)
merci beaucoup pour votre réponse. J'ai installé python et networkx. Mais je n'arrive pas à obtenir un résultat. Je vais ajouter ma vue de données et le message d'erreur. Je ne comprends pas pourquoi il dit qu'il ne peut pas cacher les nœuds 1,2 pour taper int. http://arge.kariyer.net/images/test/Capture.PNG et http://arge.kariyer.net/images/test/Capture2.PNG avez-vous une idée? – can
Désolé d'avoir entendu ça, merci d'avoir partagé les erreurs, après les avoir regardées, je ne pense pas qu'il s'agisse de "show stoppers". Alors, puis-je vous demander de 'G = networkx.read_edgelist (" evet.csv ", delimiter =", ")'. Ce qui implique que vous réenregistrez votre fichier CSV en tant que fichier séparé par une virgule plutôt que par un espace. –
Merci pour votre réponse, mais cela n'a pas changé comme vous pouvez le voir ici http://arge.kariyer.net/images/test/Capture3.PNG. Im en utilisant Visual Studio comme IDE. Pourrait-il être pertinent? Plus d'idée? – can