Besoin d'aide pour choisir une API datamining/neural-network

Je prévois de créer une fonctionnalité pour une plate-forme de commerce électronique que j'ai développée en Java pour afficher des produits connexes de la même manière qu'Amazon. Il existe différentes statistiques sur les produits associés que je souhaite explorer.Besoin d'aide pour choisir une API datamining/neural-network

Historique des achats (achetée en même temps)
Rapporté par famille/type (classification des produits similaires)
Intentionnellement liés (stimuler les résultats: "Acheter ce!")

Bien que Je serais probablement capable de développer ma propre bibliothèque de datamining, ce ne serait pas très portable et j'ose dire que ce ne serait pas très bon non plus.

Il y a plusieurs paquets pour faire ce genre de chose, mais je n'ai pas l'impression d'être en mesure d'évaluer quel paquet ou quelle solution me convient le mieux. Toute contribution anecdotique ou d'expérience personnelle serait grandement appréciée. Note: J'ai identifié cela comme un réseau neuronal à cause d'un discours python où j'étais à l'endroit où un réseau de type neuronal était utilisé pour la datamining. Je ne suis pas convaincu qu'un réseau de neurones soit le meilleur choix pour ce travail.

Source

2010-09-03 BjornS

Le filtrage collaboratif semble être une meilleure approche à votre problème que les réseaux de neurones puisque vous n'avez probablement pas une formation cohérente avec une fonction établi de coût évident. Mahout est bien supporté et basé sur Hadoop, qui est le framework Java map-reduce. Je n'en ai pas l'expérience, mais j'ai pensé que j'essaierais de vous orienter dans la bonne direction. –

@ Adriaan Koster, vous avez probablement raison :) – BjornS

Jetez un oeil à Apache Mahout

Source

2010-09-03 09:31:56

J'ai jeté un coup d'oeil, mais je ne sais pas comment il se compare à toutes les autres plates-formes là-bas et si cela va satisfaire ce que je cherche, c'est vraiment le noeud du problème ici. Sans passer beaucoup de temps ou d'efforts à évaluer chaque option, il est impossible de faire un choix rationnel. Avez-vous une expérience avec Mahout ou une raison pour le suggérer? – BjornS

Je crois que ce que vous voulez, c'est une notion de similitude d'item-item. Mahout fournit un cadre assez simple pour cela à l'intérieur de son cadre de recommandation basé sur les éléments. Regardez les implémentations de son interface 'ItemSimilarity'. Cela et le code connexe devrait faire l'essentiel de ce dont vous avez besoin. Je suivrais en tant que 'user @ mahout.apache.org'. –

Certaines techniques d'algorithme artificiel sont utilisées pour l'exploration de données, telles que C4.5 ou ID3. Ces algorithmes font la classification. D'autres techniques telles que le regroupement de fourmis, les réseaux de neurones ou les algorithmes génétiques sont utilisées à des fins de classification dans l'exploration de données.

En ce qui concerne les algorithmes, je ne connais pas grand-chose mais ID3/C4.5 peut être facilement programmé.

Espérons que cela aide.

Source

2010-09-03 09:23:27

Besoin d'aide pour choisir une API datamining/neural-network

Répondre

Questions connexes