2014-07-07 5 views
0

Je suis nouveau à mahout et je construis un recommandeur de feedback implicite en utilisant le travail parallèleALS donné here. Chaque ligne de mon dataset se compose de user_id, product_id, preference_score (qui est le nombre de visites effectuées par l'utilisateur pour le produit). Les identifiants utilisateur et produit sont de type long. J'ai un million de points de données de ce type après avoir filtré les visites simples ou doubles.Recommandation de rétroaction implicite - Résultats incorrects

J'ai fondamentalement écrit un script bash qui exécute les deux jobs "parallelALS" et "recommendedfactorized" comme montré dans l'exemple "factorize-movielens-1M". Après l'exécution du script, les recommandations résultantes semblent avoir un bug. Le format de chaque ligne des résultats (comme expliqué dans plusieurs messages de blog) semble être: -
user_id [product_id: score, ...]

Cependant, tous les products_ids dans chaque ligne est 0. Je ne suis pas sûr de ce que ça va mal ici. Est-ce un problème avec l'ensemble de données ou une question de réglage des paramètres (alpha, lambda, etc) ou autre chose?

+0

Publiez un exemple de vos données. Les ID de l'utilisateur et de l'élément doivent être des ID Mahout, ce qui signifie des entiers consécutifs. Vous devez conserver des dictionnaires pour mapper les ID d'utilisateur et d'élément vers et depuis les ID de mahout (deux HashBiMaps fonctionneront ou une base de données), ce qui manque souvent aux nouveaux utilisateurs. – pferrel

Répondre

0

Les ID de l'utilisateur et de l'article doivent être des ID Mahout, ce qui signifie des entiers consécutifs. Vous devez conserver des dictionnaires pour mapper les ID d'utilisateur et d'élément vers et depuis les ID de mahout (deux HashBiMaps fonctionneront ou une base de données), ce qui manque souvent aux nouveaux utilisateurs.

Pour dire à coup sûr poster un exemple de vos données d'entrée.

Questions connexes