2017-03-06 2 views
1

code:Python et SPSS donnant une sortie différente pour la régression logistique

from sklearn.linear_model import LogisticRegression 
l = LogisticRegression() 
b = l.fit(XT,Y) 
    print "coeff ",b.coef_ 
    print "intercept ",b.intercept_ 

est ici le jeu de données

XT = 
[[23] 
[24] 
[26] 
[21] 
[29] 
[31] 
[27] 
[24] 
[22] 
[23]] 
Y = [1 0 1 0 0 1 1 0 1 0] 

Résultat:

coeff [[ 0.00850441]] 
intercept [-0.15184511 

Maintenant, j'ai ajouté les mêmes données dans spss.Analyse -> Régression-> Régression logistique binaire. Je mets les variables Y -> dépendantes et XT -> correspondantes. Les résultats n'étaient même pas proches. Ai-je manqué quelque chose en python ou SPSS? Result of binary logistic regression on SPSS Python-Sklearn

Répondre

2

Résolu moi-même. J'ai essayé de changer la valeur C dans LinearRegression (C = 100). Cela a fait l'affaire. C = 1000 a obtenu le résultat le plus proche de SPSS et du résultat du manuel. J'espère que cela aidera tous ceux qui rencontrent des problèmes avec LogisticRegression en python.

+0

J'ai donc une autre question. Pourquoi la valeur C par défaut ne donne pas le résultat comme dans SPSS ou manuel? Est-ce que je manque quelque chose? –