Je tente de créer un moteur de recommandations basé sur un filtrage collaboratif à l'aide d'Apache Spark. J'ai pu exécuter le recommendation_example.py
sur mes données, avec un très bon résultat. (MSE
~ 0,9). Certaines des questions spécifiques que j'ai sont:Création d'un moteur de recommandation de filtrage collaboratif à l'aide de Spark mlLib
- Comment faire une recommandation pour les utilisateurs qui n'ont pas fait d'activité sur le site. N'y at-il pas un appel API pour les articles populaires, ce qui me donnerait les éléments les plus populaires en fonction des actions de l'utilisateur. Une façon de faire est d'identifier les articles populaires par nous-mêmes, et attraper l'exception
java.util.NoSuchElementException
, et de retourner ces articles populaires. - Comment recharger le modèle, après que certaines données ont été ajoutées dans le fichier d'entrée. J'essaye de recharger le modèle using une autre fonction, qui essaye de sauver le modèle, mais il donne l'erreur comme
org.apache.hadoop.mapred.FileAlreadyExistsException
. Une façon de faire est d'écouter les données entrantes sur un fil parallèle, enregistrez-le en utilisantmodel.save(sc, "target/tmp/<some target>")
, puis rechargez le modèle après réception des données importantes. Je suis perdu ici, comment y parvenir.
Ce serait très utile, si je pouvais obtenir une direction ici.
Merci. Je vais les essayer dès que possible et vous le faire savoir. :) – Abhishek