2017-09-08 9 views
1

Lorsque j'utilise la fonction de prédiction de R (v 3.4.0) pour l'arbre de classification comme ci-dessous, il me donne une sortie avec 10 colonnes.RPART expliquer la sortie de prédiction pour la matrice de type

p2 <- predict(mmodel,test_data,type = "matrix") 

sortie ressemble à ceci:

[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]  [,10] 
1  3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102 
5  3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102 
9  3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102 
13  3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102 
17  3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102 
21  3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102 
25  3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102 
29  3 0 0 37 0 0.0 0.00 1.00 0.0 0.37755102 

Je veux connaître les descriptions de ces colonnes (ce que représentent chaque colonne). J'ai 4 classes dans l'ensemble de données.

Je ne suis pas sûr de comprendre ce qui est donné sur la documentation RPART à ce sujet.

Si type = "matrix":

une matrice des réponses complètes (cadre yval2 de $ si elle existe, sinon cadre de yval $). Pour les arbres de régression, il s'agit de la réponse moyenne, pour arbres de Poisson c'est le taux de réponse et le nombre d'événements à ce nœud dans l'arbre ajusté, et pour les arbres de classification c'est la concaténation d'au moins la classe prédite, la classe compte à ce nœud dans l'arbre ajusté, et les probabilités de classe (certaines versions de Rpart peuvent contenir d'autres colonnes).

Répondre

1

Col 1: Numéro de niveau

Cols 2-5: 4 fréquences de classe

Col. 6-9: 4 probabilités de classe

Col 10: cas de ce niveau sur le nombre total de cas (le quotient de 37 à 98 peut-être)