Je courais un classificateur forêt aléatoire sur une trame de données avec des classes d'étiquette [0,1]. Mon but est d'extraire la probabilité de l'étiquette '1' de la colonne probabilityCol.
Selon le spark ml docs,
probabilityCol vecteur de longueur classes # égal à rawPrediction normalisé à une distribution multinomiale
Question:
Quel est le classement des classes cibles dans le vecteur probabilityCol? Peut-on même déterminer la même chose? Incase je veux extraire la possibilité d'une classe donnée ('1' dans mon cas), quelle est la méthode recommandée pour extraire le même.
Toutes les pistes seront appréciées.