2017-04-02 2 views

Répondre

3

En principe, ils devraient vous donner le même résultat. Mais dans la première option, vous devez utiliser d$x. Si vous utilisez juste d, la règle de recyclage dans R répétera deux fois predict(model1) (comme d a deux colonnes) et le calcul impliquera également d$y.

Notez qu'il est recommandé d'inclure na.rm = TRUE à mean et newdata = d à predict dans la première option. Cela rend votre code robuste aux valeurs manquantes dans vos données. D'autre part, vous n'avez pas besoin de s'inquiéter de NA dans la deuxième option, comme lm abandonne automatiquement NA cas. Vous pouvez jeter un oeil à ce fil pour l'effet potentiel de cette fonctionnalité: Aligning Data frame with missing values.