J'ai implémenté des Kmeans en utilisant spark. Mais comme mes données sont énormes et que le nombre de fonctionnalités est très important, je veux implémenter des mini-kilomètres en utilisant Apache MLlib. Existe-t-il un exemple ou un document sur la façon de l'implémenter?Comment implémenter les Mini-lots de batch en utilisant apache spark MLlib?
0
A
Répondre
0
Le document ci-dessous ne couvre pas l'étincelle apache MLlib, mais il ne marche à travers kmeans de minibatch:
Sculley, David. "Clustering K-Means Web-Scale." Dans les Actes de la 19e Conférence internationale sur le World Wide Web, 1177-1178. ACM, 2010. http://dl.acm.org/citation.cfm?id=1772862