Où vont les données de vérification lors de la formation d'un ANN?

La nécessité d'avoir une partie de l'ensemble de formation utilisé comme données de vérification est simple, mais je ne suis pas vraiment clair sur comment et à quel stade de la formation devrait-il être incopéré? Est-ce à la fin de la formation (après avoir atteint un bon minimum pour les données d'entraînement)? Si oui, que faut-il faire si les données de vérification donnent une grosse erreur?Où vont les données de vérification lors de la formation d'un ANN?

Est-ce tout au long de la formation (continuez de chercher un minimum alors que les erreurs pour les données d'entraînement et de vérification ne sont pas satisfaisantes)? Peu importe ce que j'essaie, il semble que le réseau éprouve des difficultés à apprendre à la fois la formation et la vérification lorsque l'ensemble de vérification atteint une certaine taille (je me souviens avoir lu quelque part que 70% de formation rester coincé à un plus petit), alors qu'il n'a aucun problème à apprendre les mêmes données lorsqu'il est utilisé entièrement pour l'entraînement.

Source

2010-01-27 sold

L'important est que votre ensemble de vérification ne doit pas avoir de retour sur la formation. Vous pouvez tracer le taux d'erreur sur l'ensemble de vérification, mais l'algorithme d'entraînement peut uniquement utiliser le taux d'erreur sur le jeu d'apprentissage pour se corriger.

Source

2010-01-27 18:17:08 Tobu

Je suis partie d'accord. La question est de savoir comment utiliser les données de vérification. – sold

Pour le traçage. Et votre "alors que les erreurs ne sont pas satisfaisantes" aurait créé une boucle de rétroaction. – Tobu

Que puis-je faire si le réseau ne fonctionne pas correctement lors de la vérification? – sold

L'ensemble de données de validation est principalement utilisé pour un arrêt précoce.

Former un réseau pour l'époque i sur les données de test. Laisser tester eerror être e (t, i).
Évaluer le réseau sur l'ensemble de validation. Soit cela e (v, i).
Si e (v, i)> e (v, i-1) arrête l'entraînement. Else goto 1.

Il vous permet de voir, lorsque le réseau overfits, ce qui signifie qu'il modélise les spécificités des données de test trop. L'idée est qu'avec un ANN, vous voulez obtenir une bonne généralisation de la formation des données à des données invisibles. L'ensemble de validation vous aide à déterminer quand le point est atteint quand il se spécialise trop sur les données d'entraînement.

Source

2010-01-28 09:46:10 bayer

parfois comme un critère d'arrêt, nous cherchons X époques consécutives d'aggravation d'erreur sur l'ensemble de validation, au lieu de s'arrêter après le premier (pour éviter la sur-sensibilité) – Amro

Oui, vous êtes là. :) – bayer

signifie que Over-formation je vous conseille de vérifier un ensemble de vérification » MSE pendant la formation voir surentraînement Système Attention de FannTool http://fanntool.googlecode.com/files/FannTool_Users_Guide.zip

Source

2010-01-29 20:30:07

Où vont les données de vérification lors de la formation d'un ANN?

Répondre

Questions connexes