Répondre

3

Fondamentalement, vous essayez de modéliser les interactions entre les utilisateurs et les éléments. La façon dont vous modéliseriez les différentes interactions consiste à attribuer un indicateur de force à chacune d'entre elles. Par exemple, vous pourriez dire qu'un clic a une force de 2, un favori une force de 5 et peut-être un achat d'une force de 15 (je dis juste des chiffres sur le dessus de ma tête).

Exemple de données d'entrée:

user1,item1,2 => he view the item 
user1,item1,5 => he made the item a favorite 
user1,item1,15 => he purchased the item 

maintenant, en interne, Myrrix ajoutera toutes ces valeurs, pour indiquer une très forte préférence pour l'article, vous donc garder toutes les interactions (et pas seulement les le plus fort)

Les métadonnées que vous pourriez avoir sur les utilisateurs ou sur l'élément peuvent également être introduites dans Myrrix en tant que «tags» pour mieux informer le modèle. Donc, vous pourriez dire qu'un utilisateur est "femme" ou un article est "jeans". Vous pouvez avoir plusieurs tags par utilisateur ou par article et chaque tag peut également recevoir un poids.

+1

Je suis d'accord. Je peux ajouter quelques directives supplémentaires: http://myrrix.com/tuning-quality/ Par exemple, les poids peuvent être choisis par fréquence relative dans les données. Quelque chose qui est 20x plus rare peut avoir 20 fois plus de poids. Aussi, voir la nouvelle API "tag" comme un moyen pratique d'ajouter des informations de catégorie/tag: http://myrrix.com/rest-api/ –

+0

Got it, si les données d'entrée ont le même UserID et ItemID, les forces sont incrémentées plutôt que de remplacer! et j'ai encore une question, si je redémarre Myrrix avec le même inputDir, si les mêmes données csv dans cet inputDir seront relues ou incrémenter l'ancienne valeur ou simplement ignorer? – piaolingxue

Questions connexes