2012-09-26 6 views
0

Ensemble de données avec 47 observations et 5 variables, (le sexe masculin est codé par 0 et la femme par 1) essayant de prédire un homme avec un statut moyen, le revenu et le verbal dépenseraient 95% CI. J'ai utilisé mes lm<-spending ~ status + income + verbal + sex, teenspend pour obtenir la moyenne. Je trouve mes coefficients comme:Intervalles de prédiction R

mdl$coefficient 
(Intercept) sexfemale  status  income 
22.55565063 -22.11833009 0.05223384 4.96197922 
     verbal 
-2.95949350 

predict(mdl, sex=0, interval='confidence', level=0.90) 

Quelques questions: je ci-dessus, mais je reçois prédire toutes les observations, comment puis-je trouver ma prédiction?

 fit   lwr  upr 
1 -10.6507430 -21.4372267 0.1357407 
2 -9.3711318 -21.9428731 3.2006095 
3 -5.4630298 -15.0782882 4.1522286 
4 24.7957487 12.5630143 37.0284831 

Veuillez clarifier?

Répondre

0

Vérifiez la documentation de predict.lm et vous verrez que l'argument sex=0 ne peut pas être utilisé ici. La méthode predict ignore cet argument et donc vous obtenez les valeurs ajustées plus l'intervalle de confiance pour TOUTES les observations dans vos données. Vous pouvez spécifier la prédiction de la manière suivante:
predict(mdl, newdata=teenspend[teenspend$sex==0,], interval="confidence")
Si vous avez réellement besoin d'un intervalle de prédiction - vous l'utilisez dans le titre de votre question - vous devez choisir interval="prediction".

Questions connexes