Comment effectuer une recherche d'arbre de décision en utilisant mapreduce? Je cherche une version optimisée

J'ai l'arbre de décision avec des millions de noeuds, sérialisés sur HDFS. Quelqu'un peut-il s'il vous plaît m'aider à donner un pointeur sur la façon de faire une meilleure sérialisation afin que je puisse effectuer une recherche plus efficacement sur Hadoop en utilisant la réduction de la carte.Comment effectuer une recherche d'arbre de décision en utilisant mapreduce? Je cherche une version optimisée

Merci.

Source

2011-04-19 deb

Bien pour traverser votre arbre, vous avez besoin que le modèle soit chargé en mémoire. Une fois chargé, il est assez facile et rapide d'effectuer une traversée d'une instance. Vous ne pouvez pas stocker votre modèle dans hdfs, donc afin d'effectuer une meilleure traversée, vous devez faire quelque chose de mieux dans votre mémoire principale. Mais comme je l'ai dit, une traversée d'arbre est toujours super rapide. Peut-être que fournir plus d'informations sur votre problème serait bien. Votre problème est d'avoir des millions de nouveaux exemples et de prédire leur étiquette?

Source

2011-12-30 18:50:48 jojoba

Comment effectuer une recherche d'arbre de décision en utilisant mapreduce? Je cherche une version optimisée

Répondre

Questions connexes