je besoin d'un algorithme d'apprentissage automatique qui satisfera aux exigences suivantes:Apprentissage automatique - classification d'une classe/détection de nouveauté/évaluation d'anomalie?
- Les données de formation sont un ensemble de vecteurs de caractéristiques, tous appartenant à la même classe « positive » (que je ne peux pas produire des échantillons de données négatives) .
- Les données de test sont des vecteurs caractéristiques appartenant ou non à la classe positive.
- La prédiction devrait être une valeur continue, qui devrait indiquer la «distance» des échantillons positifs (0 signifie que l'échantillon d'essai appartient clairement à la classe positive et 1 signifie clairement négatif, mais 0,3 signifie qu'il est plutôt positif
Exemple: Supposons que les vecteurs caractéristiques soient des vecteurs de caractéristiques 2D.
données d'entraînement positif:
- (0, 1), (0, 2), (0, 3)
données de test:
- (0, 10) devrait être une anomalie, mais pas une anomalie distincte
- (1, 0) devrait être une anomalie, mais avec un "rang" plus élevé que (0, 10)
- (1, 10) devrait être une anomalie, avec une anomalie encore plus élevée "rank"
L'idée est d'examiner la « distance » des exemples positifs (comme dans la détection d'anomalie) . Je cherche en fait un algo de détection d'anomalie en pourcentages (quelle est l'échelle de l'anomalie) – ido4848
Pouvez-vous être plus précis, p. Quelles sont vos données? Pouvez-vous fournir des exemples de données d'entrée et ce que vous attendez en conséquence? – miraculixx
@miraculixx J'ai ajouté un exemple – ido4848