Lorsque j'utilise la fonction de prédiction de R (v 3.4.0) pour l'arbre de classification comme ci-dessous, il me donne une sortie avec 10 colonnes.RPART expliquer la sortie de prédiction pour la matrice de type
p2 <- predict(mmodel,test_data,type = "matrix")
sortie ressemble à ceci:
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
1 3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102
5 3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102
9 3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102
13 3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102
17 3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102
21 3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102
25 3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102
29 3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102
Je veux connaître les descriptions de ces colonnes (ce que représentent chaque colonne). J'ai 4 classes dans l'ensemble de données.
Je ne suis pas sûr de comprendre ce qui est donné sur la documentation RPART à ce sujet.
Si
type = "matrix"
:une matrice des réponses complètes (cadre yval2 de $ si elle existe, sinon cadre de yval $). Pour les arbres de régression, il s'agit de la réponse moyenne, pour arbres de Poisson c'est le taux de réponse et le nombre d'événements à ce nœud dans l'arbre ajusté, et pour les arbres de classification c'est la concaténation d'au moins la classe prédite, la classe compte à ce nœud dans l'arbre ajusté, et les probabilités de classe (certaines versions de Rpart peuvent contenir d'autres colonnes).