Je suis généralement novice en Python et j'ai de la difficulté à créer un modèle de régression linéaire. Je dois le faire à partir d'un ensemble de formation et de test à partir d'un grand ensemble de données Excel (.csv).Meilleure façon de créer un modèle de régression linéaire à partir d'un ensemble de données .csv fractionné?
J'ai divisé l'ensemble de données déjà:
import pandas as pd
import numpy as np
df = pd.read_csv('C:/Dataset.csv')
df['split'] = np.random.randn(df.shape[0], 1)
split = np.random.rand(len(df)) <= 0.75
training_set = df[split]
testing_set = df[~split]
Comment puis-je utiliser ces données fendus pour faire un modèle de régression linéaire en utilisant l'erreur moyenne moyenne?
Merci.
Devrait-il s'agir d'une erreur absolue moyenne? –