2

J'essaie de créer un recommandeur hybride en utilisant prediction.io qui fonctionne comme une couche au-dessus de l'étincelle/mllib sous le capot.Hybrid recommender in spark

Je cherche un moyen d'incorporer un boost basé sur des balises dans l'algorithme ALS lors d'une requête de recommandation. L'utilisation d'informations sur le contenu pour améliorer le filtrage collaboratif me semble être un chemin habituel, bien que je ne trouve aucune documentation sur la combinaison d'un algorithme collaboratif (par exemple ALS) avec une mesure basée sur le contenu. Tous les exemples ou la documentation sur l'incorporation de la similarité de contenu avec le filtrage collaboratif pour mllib (spark) ou mahout (hadoop) seraient grandement appréciés.

Répondre

2

Ce modèle PredictionIO utilise la version Spark de Correlators de Mahout afin qu'il puisse utiliser plusieurs actions à recommander aux utilisateurs ou à trouver des éléments similaires. Il vous permet d'inclure plusieurs contenus catégoriels de type tag pour booster ou filtrer les recs.

http://templates.prediction.io/PredictionIO/template-scala-parallel-universal-recommendation

La branche v0.2.0 a également la date de filtrage de gamme et backfill élément populaire est en développement.

+1

J'ai déjà essayé votre modèle. Bon travail. Cependant, au lieu d'un événement primaire, je veux prédire que je veux prédire l'interaction de l'utilisateur avec une page (niveau d'intérêt) qui pourrait être considérée comme une combinaison de mes 3 événements (voir, partager et commenter) à un nombre (le nombre de vues est-il important?) Est-il possible d'incorporer cette "note" dans l'algorithme basé sur l'analyse de similarité? – rtemperv

+0

http://predictionio.incubator.apache.org/PredictionIO/template-scala-parallel-universal-recommendation - - Ce lien ne fonctionne pas –