2016-12-26 1 views
0

liés à: Simple Python implementation of collaborative topic modeling?En quoi le filtrage collaboratif et la modélisation de thèmes sont-ils différents et en quoi sont-ils identiques?

Je suis en train de saisir les différences fondamentales et les parties fondamentales qui sont les mêmes dans collaborative-filtering et topic-modeling. Les deux me semblent très similaires: essayer de chercher une dimension latente qui peut prédire de manière compacte quel utilisateur aimerait quel film, ou quel document contiendrait quel mot? Pouvez-vous faire la lumière ou m'envoyer à des sources qui clarifieront cela?

Merci!

Répondre

2

Je pense que cet article est votre meilleur pari:

https://www.cs.princeton.edu/~blei/papers/WangBlei2011.pdf

Il parle de combiner le filtrage collaboratif et la modélisation de sujet (deux choses vraiment distinctes). Il y a peut-être une certaine ressemblance si vous regardez surtout probabilistic matrix factorization for collaborative filtering et probabilistic topic modeling, dans la façon dont les solutions sont générées, mais cela reste plutôt limité. De votre question, il n'est pas clair si vous vous posez des questions sur topic modeling ou collaborative topic modeling. Néanmoins, le papier je l'ai mentionné donne quelques informations sur le filtrage collaboratif (à travers la matrice factorisation), des renseignements généraux sur la modélisation du sujet probabiliste puis:

COLLABORATIF SUJET REGRESSION (CTR), CTR combine le filtrage collaboratif traditionnel traditionnel avec modélisation sujet .

viens juste de réaliser que ce document est déjà référencé dans la question que vous liez, alors laissez-moi partager une autre ressource, cet article dans le New York Times qui est moins mathématiques lourds

http://open.blogs.nytimes.com/2015/08/11/building-the-next-new-york-times-recommendation-engine/

Où ils décrivent, comment ils ont effectivement mis en œuvre l'approche de l'article mentionné ci-dessus.

Au contraire pour plus de détails sur la modélisation du sujet que je vous suggère de plonger dans les ressources sur cette page:

https://www.cs.princeton.edu/~blei/topicmodeling.html

et ce document pour la matrice factorisation pour le filtrage collaboratif:

https://datajobs.com/data-science-repo/Recommender-Systems-%5BNetflix%5D.pdf