2013-03-09 6 views
0

Cela doit être une question assez standard: j'ai des données de retour qui ont des erreurs (ce sont des erreurs réelles, pas seulement des retours importants). Je pense à la meilleure façon de corriger cela afin qu'il n'influence pas mes régressions. Une idée consiste simplement à définir des rendements qui sont dans les quantiles extrêmes pour signifier le retour. Une autre solution: ont lm ignorer ces valeurs extrêmes. Y at-il un moyen intégré dans lm pour lui faire ignorer les valeurs extrêmes? Je sais que Matlab a quelque chose appelé la régression de Roust qui fait juste cela.robuste aux valeurs aberrantes lm dans R

+1

[La vue des tâches CRAN] (http://cran.r-project.org/web/views/Robust.html) sur les méthodes statistiques robustes devrait vous aider à démarrer. –

+0

La robustesse ne signifie pas nécessairement éliminer les valeurs aberrantes, mais peut aussi être basée sur des estimateurs qui ne sont pas aussi facilement influencés par eux (le plus trivial étant la moyenne par rapport à la médiane). Ainsi, je ne vois pas de doublon là-bas. – Thilo

Répondre

4

Y a-t-il un chemin intégré dans lm pour faire en sorte qu'il ignore les valeurs extrêmes?

Oui. Vous devez regarder rlm. Pour plus d'informations, consultez le CRAN Task for robust methods. (Josh a déjà donné ce lien)

+0

Voici un exemple de régression robuste http://r-statistics.co/Robust-Regression-With-R.html – Selva

Questions connexes