2017-03-20 1 views
0

J'essaie de comprendre une citation "En présence de variables corrélées, la régression de crête pourrait être le choix préféré." Disons que nous avons les variables a1, a2, b1, c2, et les 2 a "s sont corrélés Si nous utilisons Lasso, il peut éliminer l'un des" s. Lasso et Ridge feront tous les deux rétrécir. Donc ça sonne Lasso pourrait être mieux dans ces conditions. Mais la citation dit Ridge est meilleur. Est-ce une citation erronée ou il me manque quelque chose? (Peut-être penser trop simple)Lasso ou Ridge pour les variables corrélées

+0

Pouvez-vous inclure un lien vers le devis? Quel est le contexte? – ilanman

Répondre

0

En général, il n'y a pas d'approche préférée. LASSO conduira vraisemblablement certains coefficients à 0, alors que Ridge ne va pas réduire leurs valeurs. En outre, Ridge est susceptible d'être plus rapide en termes de calcul car minimiser la norme L2 est plus facile que la norme L1 (LASSO).

Si possible, pourquoi ne pas implémenter les deux approches et effectuer une validation croisée pour voir qui donne de meilleurs résultats?

Enfin, je recommande également d'examiner Elastic Net qui est une sorte d'hybride de LASSO et Ridge.