2010-10-27 3 views
2

J'essaie de former un réseau de neurones pour un système qui peut être considéré comme un réseau postal de niveau macro. Mes entrées sont deux emplacements (l'un des 50 États américains) avec 1 à 3 autres variables, et je veux un résultat numérique.Propery Mise en place d'un réseau de neurones pour l'analyse Location to Location

Ma première inclination était de représenter les états sous la forme d'une valeur numérique de 0 à 49 puis d'avoir un réseau avec seulement 3 entrées. Ce que j'ai trouvé, cependant, c'est que ma formation ne converge jamais sur une valeur utile. Je suppose que c'est parce que les valeurs pour les états sont totalement arbitraires - une valeur de 39 pour MA n'a pas de relation avec une valeur de 38 pour CA, surtout quand 37 représente un retour à CT.

Y a-t-il une meilleure façon de faire cela? Dois-je créer un réseau avec plus de 100 entrées, représentant des valeurs booléennes pour les états d'origine et de destination?

+0

Il serait très utile de savoir quelles opérations sont effectuées; quelle transformation la sortie représente-t-elle à partir des entrées? Cela aiderait à déterminer si votre encodage choisi pour les états est approprié ou non. –

Répondre

1

Je pense que votre intuition sur la difficulté de représenter différents états comme des entiers consécutifs est correcte - cette représentation compresse beaucoup d'informations dans chaque entrée. Cela signifie que votre réseau devra peut-être apprendre beaucoup sur la façon de décoder ces informations en faits qui sont réellement utiles pour résoudre votre problème.

Un état par entrée, avec des entrées booléennes, pourrait aider. Cela permettrait au réseau de déterminer plus facilement quels sont les deux états dont vous parlez. Bien sûr, cette approche ne permet pas nécessairement au réseau d'apprendre des faits utiles tels que les états adjacents les uns aux autres.

Il pourrait être utile d'essayer de déterminer s'il y a toutes sortes d'informations là-bas qui sont à la fois facile pour vous de fournir et pourrait aussi faciliter l'apprentissage . Par exemple, si la disposition physique des états est importante pour résoudre votre problème (c.-à-d. Adjacente à NY, adjacente à PA), vous pourriez peut-être diviser le pays en régions (eg nord-ouest, sud-est, midwest) et fournir des booléens. entrées pour chaque région. Nourrir quelques schémas d'entrée comme ça dans un réseau unique pourrait vous permettre de spécifier un seul état en utilisant une représentation (potentiellement) plus utile: au lieu de dire "c'est l'état # 39", vous pourriez dire (par exemple) " c'est l'état le plus au nord qui touche plus de cinq états voisins dans la région orientale ". Si le réseau trouve utile de déterminer si deux états sont proches, ce type de représentation pourrait rendre l'apprentissage un peu plus rapide - le réseau pourrait avoir une idée approximative si deux états sont proches en comparant simplement les deux. région "entrées pour les états. Il est beaucoup plus facile de vérifier si deux entrées de région sont égales que de mémoriser le fait que l'état # 39 est proche des états # 38, # 21, # 7 et # 42.