2016-12-31 1 views
-2

Quelqu'un peut-il aider à l'utilisation de cette ligne de code:« Introduction à l'apprentissage statistique » Chapitre 5 - Rééchantillonnage p.191

library(ISLR) 
set.seed(1) 
train=sample(392,196) 
lm.fit=lm(mpg~horsepower,data=Auto,subset=train) 
attach(Auto) 
mean((mpg-predict(lm.fit,Auto))[-train]^2) 

Je suis à la recherche de l'aide sur la dernière ligne de code. Quelqu'un peut-il expliquer ce qu'il fait? (en particulier la syntaxe "mpg-Predict .." et l'utilisation du "-")

Pour référence cela vient: "Introduction à l'apprentissage statistique: avec des applications en R". Chapitre 5 - Rééchantillonnage. (P.191)

Répondre

2

enter image description here

Je pense que vous faites référence à cette page.

Il y a deux - ici.

Le premier en mpg-predict est simplement le signe moins. predict est la fonction pour la prédiction de modèle. Lire ?predict et ?predict.lm pour plus d'informations. La raison pour laquelle vous pouvez prendre la soustraction entre mpg et le résultat de la prédiction, c'est que vous avez attach l'ensemble de données. Vous pouvez également utiliser Auto$mpg - predict(lm.fit, Auto).

La seconde avec -train est pour le sous-ensemble. Voici un exemple simple:

x <- 1:5 
x[-(2:3)] ## drop element 2 to 3 
+0

Parfait merci !! Je voulais dire que je voulais dire le premier "-". Et cela a du sens maintenant. Je n'avais pas réalisé que c'était simplement une soustraction ... Je pensais que le premier "-" était utilisé comme le "sous-ensemble". Je vous remercie –