Calcul de MSE: pourquoi ces deux façons donnent-elles des résultats différents?

J'ai quelques doutes concernant le calcul de MSE dans R.Calcul de MSE: pourquoi ces deux façons donnent-elles des résultats différents?

J'ai essayé deux manières différentes et j'obtiens deux résultats différents. Je voulais savoir lequel est la bonne façon de trouver mse.

Première:

model1 <- lm(data=d, x ~ y) 
rmse_model1 <- mean((d - predict(model1))^2)

Deuxième:

mean(model1$residuals^2)

Source

2017-04-02 Julius Knafl

Merci! Oui, en effet, donne le même résultat. –

En principe, ils devraient vous donner le même résultat. Mais dans la première option, vous devez utiliser d$x. Si vous utilisez juste d, la règle de recyclage dans R répétera deux fois predict(model1) (comme d a deux colonnes) et le calcul impliquera également d$y.

Notez qu'il est recommandé d'inclure na.rm = TRUE à mean et newdata = d à predict dans la première option. Cela rend votre code robuste aux valeurs manquantes dans vos données. D'autre part, vous n'avez pas besoin de s'inquiéter de NA dans la deuxième option, comme lm abandonne automatiquement NA cas. Vous pouvez jeter un oeil à ce fil pour l'effet potentiel de cette fonctionnalité: Aligning Data frame with missing values.

Source

2017-04-02 02:56:44

Calcul de MSE: pourquoi ces deux façons donnent-elles des résultats différents?

Répondre

Questions connexes