4

Je travaille sur une prévision de flux de trafic où je peux prédire qu'un endroit a un trafic lourd ou léger. J'ai classé chaque trafic comme 1-5, 1 étant le trafic le plus léger et 5 étant le trafic le plus lourd.A propos de l'algorithme adaboost

Je suis tombé sur ce site Web http://www.waset.org/journals/waset/v25/v25-36.pdf, algorithme AdaBoost, et j'ai vraiment de la difficulté à apprendre cet algorithme. Spécialement dans la partie où S est l'ensemble ((xi, yi), i=(1,2,…,m)). où Y={-1,+1}. Quels sont x, y et la constante L? quelle est la valeur de L?

Quelqu'un peut-il m'expliquer cet algorithme? :)

Répondre

4

S={(x1,y1),...,(xm,ym)}: Chaque (x,y) paire est un échantillon utilisé pour la formation (ou tests) votre classificateur:

  • x = Les caractéristiques qui décrivent cet échantillon particulier, pour des exemples de valeurs qui énumèrent les amount of cars on the road, day of the week, etc
  • y = L'étiquette pour un x particulier, ce qui dans votre cas peut être 1, 2, 3, 4 or 5

Table 1 dans le document présente les caractéristiques x qu'ils utilisaient, à savoir: DAY, TIME, INT, DET, LINK, POS, GRE, DIS, VOL et OCC. La dernière colonne du tableau montre l'étiquette (y), qu'ils ont définie sur 1 ou -1 (c'est-à-dire, yes ou no). Chaque ligne de la table contient 1 échantillon.

L est le nombre de tours dans lesquels AdaBoost forme un faible apprenant (dans l'article Random Forests est utilisé comme classificateur faible). Si vous définissez L à 1 alors AdaBoost exécutera 1 tour et seulement 1 classificateur faible sera formé, ce qui aura de mauvais résultats. Effectuez plusieurs expériences avec des valeurs différentes pour L pour trouver la valeur optimale (c'est-à-dire, lorsque AdaBoost est convergé ou lorsqu'il commence à être surcoupé).