J'ai l'arbre de décision avec des millions de noeuds, sérialisés sur HDFS. Quelqu'un peut-il s'il vous plaît m'aider à donner un pointeur sur la façon de faire une meilleure sérialisation afin que je puisse effectuer une recherche plus efficacement sur Hadoop en utilisant la réduction de la carte.Comment effectuer une recherche d'arbre de décision en utilisant mapreduce? Je cherche une version optimisée
Merci.