2

J'apprends l'apprentissage statistique ces jours-ci en utilisant les pandas python et la bibliothèque scikit-learn et ce sont des outils fantastiques pour moi.comment puis-je faire un modèle de recommandation en utilisant scikit-learn de python

J'aurais pu apprendre le mode de classification, de régression et aussi de clustering avec eux bien sûr. Mais je ne trouve pas le moyen de commencer avec eux quand je voudrais faire un modèle de recommandation. Par exemple, si j'ai le jeu de données d'achat d'un client, qui contient la date, le nom du produit, le fabricant du produit, le prix, le périphérique de commande, etc.

Quel est le type de recommandation de problème? classification, régression ou autre chose? En fait, je pourrais trouver des algorithmes très connus comme le filtrage collaboratif quand quelqu'un doit résoudre ce problème.

Si oui, puis-je utiliser ces algorithmes en utilisant scikit-learn? ou devrais-je apprendre une autre bibliothèque de M.L?

Cordialement

Répondre

4

scikit-learn ne propose pas d'outils de système de recommandation. Vous pouvez jeter un oeil à mahout qui donne vraiment facile à démarrer la proposition ou spark.

Cependant la recommandation est un problème en soi dans le mot d'apprentissage automatique. Cela peut être une régression si vous essayez de prédire le taux qu'un utilisateur donnerait à un film par exemple ou par classification si vous voulez savoir si un utilisateur va aimer le film ou non (choix binaire). L'important est que la recommandation utilise des outils et des algorithmes dédiés à ce problème, comme la recommandation basée sur les éléments ou sur le contenu. Ces concepts sont en fait assez simples à comprendre et vous mettre en place un petit moteur de recommandation pourrait être le meilleur.

conseils

I vous le livre mahout in action qui est une excellente introduction à concept recommandation

+0

merci beaucoup. En fait, je voulais juste utiliser Sklearn et la combinaison de pandas en raison de la facilité d'utilisation s'il y a un moyen et de la cue je suppose qu'il peut y avoir absolument une bonne solution basée sur eux. mais, après quelques jours de googling je ne pouvais pas trouver de toute façon et j'ai déjà commencé à apprendre le cadre d'allumage pour ce programme. – mac475

+0

Vous pouvez garder les pandas dans votre boîte à outils pour recommander mais scikit learn n'apporte pas d'algorithme dédié. – MathiasDesch

+0

ok, j'ai compris. en fait, je l'ai construit en utilisant le cadre de l'étincelle comme pour la recommandation, mais j'ai également utilisé des pandas lors du nettoyage et de l'agrégation des données. – mac475

1

Que diriez-vous de crabe https://github.com/python-recsys/crab, qui est cadre aa Python pour la construction de moteurs de recommender intégrés avec le monde des paquets Python scientifiques (numpy, scipy, matplotlib).

Je n'ai pas utilisé ce cadre mais je l'ai trouvé. Et il semble qu'il n'y a que la version 0.1 et que le crabe n'a pas été mis à jour depuis des années. Donc je doute qu'il soit bien documenté. Peu importe, si vous décidez d'essayer Crab, s'il vous plaît nous donner un retour après cela :)

+1

Malheureusement, je ne pense pas que cela répond vraiment à la question. OP veut savoir quel type d'algorithme ils devraient utiliser. Je pense que c'est mieux s'ils développent une meilleure compréhension de leur problème, avant d'ajouter plus d'outils. –