Existe-t-il un moyen de vérifier la dépendance linéaire pour les colonnes dans une base de données pandas? Par exemple:Existe-t-il un moyen de vérifier les colonnes linéairement dépendantes dans une base de données?
columns = ['A','B', 'C']
df = pd.DataFrame(columns=columns)
df.A = [0,2,3,4]
df.B = df.A*2
df.C = [8,3,5,4]
print(df)
A B C
0 0 0 8
1 2 4 3
2 3 6 5
3 4 8 4
est-il un moyen de montrer que la colonne B
est une combinaison linéaire de A
, mais C
est une colonne indépendante? Mon but ultime est d'exécuter une régression poisson sur un ensemble de données, mais je continue d'obtenir une erreur LinAlgError: Singular matrix
, ce qui signifie qu'il n'y a pas d'inverse de ma base de données et qu'elle contient donc des colonnes dépendantes.
Je voudrais trouver un moyen de vérifier chaque fonction et de vérifier qu'il n'y a pas de colonnes dépendantes.
vous devriez être en mesure de réaliser ce que vous avez besoin avec 'numpy' et ce poste: https://stackoverflow.com/questions/28816627/how-to-find-linearly-independent-rows -à partir d'une matrice –