0

J'étudie un peu de ML et je suis resté coincé avec quelques points d'interrogation dans ma tête, surtout sur le perceptron. Donc par exemple je demande:Quelques questions à propos de Perceptron

1) On peut voir b le biais et w les poids comme les coefficients de notre séparateur linéaire droit? Ceci n'est valable que si nous sommes en 2D où le séparateur linéaire est une ligne?

2) Notre but est de créer une ligne afin de diviser exactement les points de données dans nos données d'entraînement? Moyens, à la fin de la phase d'apprentissage, l'algorithme a "découvert" la ligne (si nous sommes en 2D) qui sépare le mieux les deux types de points. Cela se produit parce que les données d'apprentissage ont la bonne étiquette y et l'algorithme peut trouver la distance entre la vraie étiquette et la prédiction. Donc en passant à la phase de test, les points de test n'ont pas d'étiquette avec eux donc dans mon idée, perceptron ne reconnaît que si le point de test est au-dessus ou au-dessous de la ligne retournée. Cela conduit à la classification?

3) Quelqu'un aussi utiliser cette notation pour l'activer fucntion treshold

http://latex.codecogs.com/gif.latex?\small&space;Y_{i}\begin{bmatrix}&space;<w,x_{i}>&plus;b&space;\end{bmatrix}\leq&space;0 est le même que l'autre qui utilise la différence d'erreur? Si je ne me trompe pas, ceci est utilisé pour les classes -1/+ 1. Par ailleurs, nous mettons en relation le label Yi de mon observation i et la valeur de sortie du perceptron?

Un grand merci et désolé pour ma mauvaise faute de frappe

Répondre

0

1) w et b sont les coefficients d'un séparateur linéaire, quelle que soit la dimension. w et b représentent conjointement l'ensemble des points où w^T x + b = 0. w a la même dimensionalité que x, et b est toujours un scalaire.

Cet ensemble de points sépare l'espace en deux zones. Dans le cas de 2 dimensions, l'ensemble des points correspond à une ligne. Dans le cas de 3 dimensions, cela correspondrait à un plan. Dans les dimensions supérieures, vous ne pouvez pas vraiment le visualiser, mais cela fonctionne toujours de la même manière. On se réfère à un hyperplan en général.

2) Partiellement correct. Les données de test sont là pour vérifier la performance de votre perceptron. Vous ne pouvez pas savoir à quel point il fonctionne si vous ne connaissez pas les vraies classes des données de test. Ce que vous faites habituellement est de mesurer quel pourcentage des données de test votre perceptron classifie correctement (connu sous le nom précision). Cependant, les données de test n'influent pas sur le perceptron. C'est seulement là pour le tester.

3) C'est une notation inhabituelle, vous devriez fournir un peu de contexte, sinon je ne peux pas vous dire ce qu'il est censé représenter.

+0

2) Mais nous formons notre classificateur afin de classer les points de données de l'ensemble de test. Je veux dire que les données de test sont la preuve finale de la façon dont se comporte notre modèle. Donc, si la ligne retournée est "valide" pour les données d'entraînement, comment peut-elle être valable aussi pour les données de test? Je veux dire, que se passe-t-il lorsque nous injectons au perceptron un nouveau vecteur en tant que données de test? – rollotommasi