Je travaille actuellement sur l'identification des valeurs aberrantes dans mes ensemble de données en utilisant la méthode IsolationForest en Python, mais ne comprennent pas complètement l'exemple sur sklearn:Forêt
Plus précisément, ce qui est le graphique nous montrant réellement? Les observations ont déjà été définies comme normales/aberrantes - donc je suppose que la nuance de la courbe de niveau indique si cette observation est effectivement une aberration (par exemple, les observations avec des scores d'anomalie plus élevés se trouvent dans des zones plus sombres).
Enfin, comment la section de code suivante est-elle réellement utilisée (en particulier les fonctions y_pred)?
# fit the model
clf = IsolationForest(max_samples=100, random_state=rng)
clf.fit(X_train)
y_pred_train = clf.predict(X_train)
y_pred_test = clf.predict(X_test)
y_pred_outliers = clf.predict(X_outliers)
Je suppose qu'il a été simplement fourni pour l'exhaustivité dans le cas où quelqu'un veut imprimer la sortie?
Merci d'avance pour l'aide!
(at) bosbraves Est-ce que ma solution a fonctionné? – sera
Oui, merci! – bosbraves
cela vous dérange d'accepter la réponse? – sera