Je suis en train de comprendre la régression dans R. Je suis en train de résoudre un wich d'exercice a un ensemble de données 100 hommes-femmes au hasard comme ceci:régression en R avec des variables
sex sbp bmi
male 130 40.0
female 126 29.0
female 115 25.0
male 120 33.0
female 128 34.0
...
Je veux un résumé numérique (0) trace la relation entre sbp et bmi (1) et estime les paramètres beta1, beta2 et sigma avec R^2 (2). Ensuite, vérifiez la bonté du modèle (3) et obtenir les intervalles de confiance (4) ..
Je pense que le sexe est une variable, alors voici c'est mon code:
as.numeric(framingham$sex) - 1
apply(framingham, 2, class)
#0
framingham$sex <- factor (framingham$sex)
levels (framingham$sex) <- c("female", "male")
resultadoNumerico <- compareGroups(~., data = framingham)
resumenNumerico <- createTable(resultadoNumerico)
resumenNumerico
# 1
framinghamMatrix <- data.matrix(framingham)
pairs(framinghamMatrix)
cor(framinghamMatrix)
#2
regre <- lm(sbp ~ bmi+sex, data = framingham)
regreSum <- summary(regre)
regreSum
# Sigma
regreSum$sigma
# Betas
regreSum$coefficients
#3
plot(framingham$bmi, framingham$sbp, xlab = "SBP", ylab = "BMI")
abline (regre)
Mais je pense que je ne fais pas les choses correctement ... Pourriez-vous m'aider? Merci d'avance ...
Je n'ai pas encore exécuté le code mais pourriez-vous dire pourquoi vous pensez que vous vous trompez? –
Cause alors j'ai besoin de comparer les droites de régression des hommes et des femmes et le résumé du modèle n'en donne qu'un: Coefficients: Estimation Std. Erreur t valeur Pr (> | t |) (Interception) 79.0624 11.0716 7.141 1.71e-10 *** bmi 1.9338 0.3965 4.877 4.21e-06 *** sexfemale 3.0395 3.7731 0.806 0.422 –
Vous obtenez seulement une estimation pour un niveau d'un facteur à 2 niveaux car l'autre niveau est le niveau de référence. Si vous aviez les deux, vous tomberiez dans le «piège à variables factices» et les résultats seraient insignifiants. http://www.algosome.com/articles/dummy-variable-trap-regression.html –