Répondre

1

Le code de recommandation de Mahout peut lire directement à partir d'une base de données ou d'un fichier - si les données sont raisonnablement formatées. Il ne lira pas les fichiers journaux généraux; ils doivent être traduits en CSV simple ou en TSV. Mais il peut lire à peu près n'importe quelle table qui contient des utilisateurs/articles/préférences.

Si vous mettez déjà vos données dans une table de base de données, je dirais qu'il faut les laisser là et ne pas les dupliquer ou les exporter inutilement. Vous voudrez probablement que Mahout aspire tout cela en mémoire, si possible. Si vous ne stockez pas déjà ces données et que vous souhaitez choisir une représentation simple et efficace, je vous suggère d'extraire les informations utilisateur/élément/préférence et de les stocker dans des fichiers CSV simples, compressés avec gzip. Ceux-ci peuvent aussi être utilisés facilement avec Mahout et seront plus simples et plus compacts que les fichiers journaux complets ou une base de données.

Questions connexes