2017-10-09 4 views
0

J'ai besoin de construire un arbre de décision avec Matlab. J'utilise la fonction fitctree. Mon ensemble de données contient 27 prédicteurs et 4 sorties (labels de classe) possibles qui sont {2; 3; 5; 7}. Cependant, quand je trace l'arbre, je n'ai que 2 attributs (avec un arbre à 3 niveaux) comme vous pouvez le voir sur this picture.Seuls quelques attributs sont affichés dans mon arbre de décision avec la commande fitctree de Matlab

Ai-je manqué quelque chose avec la théorie de l'arbre de décision? Devrais-je utiliser un sac d'arbres? Si oui, pourquoi est-ce la solution et combien d'arbres dois-je tracer? Comment interpréter l'information?

Je vous remercie vraiment à l'avance,

Iconoclastor.

Répondre

0

Le fait est que les 4 classes peuvent être distinguées par l'arbre en utilisant trois attributs. Il ne sert à rien d'y ajouter artificiellement plus d'attributs. En fait, c'est une bonne chose si un problème nécessite moins d'attributs à résoudre. Dans votre cas, vous pouvez même visualiser la décision dans un espace 3D, ce qui rend votre problème parfaitement interprétable.

Un sac d'arbres est juste une collection ou un ensemble d'arbres, tous effectuant la même tâche sur un jeu de données d'entrée limité. Ainsi, au lieu de transmettre toutes vos données d'entraînement à un arbre, vous développez plusieurs arbres, mais chacun d'entre eux seulement avec un sous-ensemble des données d'origine. Finalement, les résultats de tous les arbres sont combinés.