2010-08-16 7 views
4

Je suis à la recherche d'ensembles de données qui peuvent être utilisés pour implémenter le système de recommandation d'Apache Mahout. Je connais seulement MovieLens Data Sets du groupe GroupLens Research.Datasets pour Apache Mahout

Quelqu'un connaît-il d'autres ensembles de données pouvant être utilisés pour la mise en œuvre du système de recommandation? Je suis particulièrement intéressé par les ensembles de données basés sur des items bien que d'autres ensembles de données soient les bienvenus.

Répondre

4

c'est Sebastian de Mahout.

Il y a un jeu de données à partir d'un tchèque datant site disponible qui pourrait être vous intéresser: http://www.occamslab.com/petricek/data/

Btw la base élément terme fait référence à une approche de filtrage collaboratif spécial de ne pas l'ensemble de données lui-même, qui est généralement la forme courante des tripels d'évaluation des utilisateurs que la plupart des approches de filtrage collaboratif utilisent.

Nous aimerions entendre vos résultats d'expérimentation et d'expériences (si vous voulez les partager) sur notre utilisateur à [email protected] mailinglist

+0

Merci Sebastian. Je partagerais définitivement mes résultats une fois terminé. –

3

Tout en recherchant des ensembles de données, j'ai trouvé quelques sites qui liste les ensembles de données accessibles au public qui peuvent être utilisés pour l'exploration de données. Certains d'entre eux peuvent aussi être utilisés pour Mahout.

Bixo Labs

UCI Datasets

KDnuggets

Questions connexes