2017-04-05 1 views
1

Je suis nouveau à R. Je l'ai écrit un exemple de code comme suit:Comment l'argument 'level =' de la fonction 'predict' est-il justifié?

model <- lm(Height~Age,data = class) 
predict(model,data.frame(Age=35),interval = "confidence",level = .95) 
predict(model,data.frame(Age=35),interval = "confidence",level = .99) 
predict(model,data.frame(Age=35),interval = "confidence",level = .90) 

Avec les résultats:

predict(model,data.frame(Age=35),interval = "confidence",level = .95) 
     fit  lwr  upr 
1 69.77465 53.73338 85.81591 
> predict(model,data.frame(Age=35),interval = "confidence",level = .99) 
     fit  lwr  upr 
1 69.77465 45.46979 94.0795 
> predict(model,data.frame(Age=35),interval = "confidence",level = .90) 
     fit  lwr  upr 
1 69.77465 57.0357 82.51359 

Maintenant, ma confusion est: lorsque le niveau de confiance augmente de 90% à 99% la gamme d'ajustement est en augmentation mais à ma connaissance dans les statistiques lorsque le niveau de confiance augmente (c.-à-d. La marge d'erreur diminue) la gamme devrait diminuer. Je suis sûr que je me trompe quelque part. Aide de Plz

+0

Si vous êtes sûr à 99% que la valeur réelle se situe entre 45,47 et 94,08, qu'arrive-t-il à votre confiance lorsque ce groupe est réduit? Allons à l'extrême ... quelle confiance avez-vous que la vraie valeur se situe entre 65,1 et 65,2? Très probablement une très faible confiance. À partir de là, comprenez que l'augmentation de la confiance entraîne un intervalle plus large. – r2evans

+0

L'argument 'level' ne définit pas votre confiance dans le modèle: il définit la confiance que la prédiction contiendra la vraie valeur (compte tenu des données antérieures et des paramètres du modèle). – r2evans

+0

Assurez-vous d'avoir en tête la définition fréquentiste d'un intervalle de confiance: voir http://stats.stackexchange.com/questions/158570/interpretation-of-confidence-interval – Marius

Répondre

3

Absolument pas. Si le caractère aléatoire des données reste inchangé, vous serez de plus en plus confiant dans l'estimation de votre intervalle à mesure que l'intervalle s'agrandira.

Si cela n'est toujours pas clair pour vous, prenez l'exemple le plus illustratif. Vous voulez proposer un intervalle (-a, a) pour contenir un échantillon aléatoire de N(0, 1). Maintenant, si a = 1, l'intervalle a seulement 67% de chance de contenir un tel échantillon aléatoire, mais si a = 3, votre confiance augmente à 99%.