2017-07-26 3 views
0

Quelqu'un pourrait m'aider à interpréter la sortie de la fonction alias pour tester la multicolinéarité dans un modèle de régression multiple. Je sais que certaines variables prédicteurs dans mon modèle sont fortement corrélées, et je veux les identifier en utilisant la table alias.Interprétation Alias ​​table test multicolinéarité du modèle dans R

Model : 
Score ~ Comments + Pros + Cons + Advice + Response + Value + Recommendation 
+ 6Months + 12Months + 2Years + 3Years + Daily + Weekly + Monthly 

Complete : 
      (Intercept) Comments Pros Cons Advice Response Value1 
UseMonthly1  0   0 0 0 0  0   0     
      Recommendation1 6Months1 12Months1 2Years1 
UseMonthly1 0    1  1  1    
      3Years1 Daily1 Weekly1 
UseMonthly1 1   -1  -1  

Valeur, Recommandation, 6Mois, 12mois, 2 ans, 3 ans, quotidienne, hebdomadaire et mensuel sont binaires variables.
Score, Commentaires, Avantages, Contre, Conseils et Réponse sont des variables numériques.

Puis-je supposer que UseMonthly est hautement corrélé avec 6Mois, 12 mois, 2ans, 3ans, Quotidien, Hebdomadaire? Quelle est la différence entre les valeurs 1 et -1 dans la sortie alias? Est-ce une corrélation positive et négative?

Répondre

0

Les entrées non nulles dans la matrice "complète" indiquent que ces termes dépendent linéairement de UseMonthly. Cela signifie qu'ils sont fortement corrélés, mais les termes peuvent être fortement corrélés sans être linéairement dépendants.

Si votre but est d'identifier et de supprimer les variables corrélées, vous devez supprimer UseMonthly, mais vous souhaiterez probablement également en supprimer d'autres. Une manière courante d'identifier des variables qui peuvent être problématiques en ce qui concerne la multicolinéarité est de rechercher des facteurs d'inflation de variance importants (calculés par exemple par car::vif).