J'ai un ensemble de données avec une variable cible qui peut avoir 7 étiquettes différentes. Chaque échantillon de mon jeu d'apprentissage n'a qu'une seule étiquette pour la variable cible.Sklearn - Comment prédire la probabilité pour toutes les étiquettes cibles
Pour chaque échantillon, je veux calculer la probabilité pour chacune des étiquettes cibles. Donc ma prédiction serait composée de 7 probabilités pour chaque rangée.
Sur le site Web sklearn, j'ai lu à propos de la classification multi-étiquettes, mais cela ne semble pas être ce que je veux.
J'ai essayé le code suivant, mais cela ne me donne qu'une classification par échantillon.
from sklearn.multiclass import OneVsRestClassifier
clf = OneVsRestClassifier(DecisionTreeClassifier())
clf.fit(X_train, y_train)
pred = clf.predict(X_test)
Quelqu'un a-t-il des conseils à ce sujet? Merci!
Dans la version 0.0.4 de scikit-multilearn, récemment publiée, vous trouverez des implémentations de predict_proba pour les méthodes de classification multi-étiquettes basées sur la transformation de problèmes. Dans le cas ci-dessus, remplacez la dernière ligne par: predictions = classifier.predict_proba (X_test) – niedakh