2010-04-08 4 views
7

Espérons que la dernière question NN que vous obtiendrez de moi ce week-end, mais ici va :)Neural Network: Gestion des entrées non disponibles (données manquantes ou incomplètes)

Y at-il un moyen de gérer une entrée que vous « don 'ne sais pas toujours' ... cela n'affecte donc pas les pondérations? Donc, si je demande à quelqu'un s'il est un homme ou une femme et qu'il n'aimerait pas répondre, y a-t-il un moyen de ne pas tenir compte de cette entrée? Peut-être en le plaçant carrément au centre? (? Supposant 1,0 à 0,5 entrées)

Merci

Répondre

4

Vous savez probablement ou soupçonnez, mais il n'y a aucune base statistique pour deviner ou fournir les valeurs manquantes en moyenne sur toute la plage de valeurs possibles, etc.

Pour NN en particulier, il y a un certain nombre de techniques avaialble. La technique que j'utilise - que j'ai codée - est l'une des techniques les plus simples, mais elle a une base statistique solide et elle est toujours utilisée aujourd'hui. L'article académique qui le décrit here.

La théorie qui sous-tend cette technique est l'intégration pondérée sur les données incomlete. En pratique, aucune intégrale n'est évaluée, à la place, elle est approximée par des solutions de forme fermée des réseaux de fonctions de base gaussiennes. Comme vous le verrez dans l'article (ce qui est une explication étape par étape, il est simple à implémenter dans votre algorithme backprop

+0

Et ce papier, du titre ressemble exactement à ce que je cherche. Je vais jeter un coup d'oeil demain matin. Merci à vous aussi :) – Micheal

+0

pas de problème - si vous avez une langue particulière à l'esprit, je peux probablement suggérer quelques ressources de plus. (Aussi, je vais éditer votre article juste pour ajouter la balise "Machine Learning", si cela ne vous dérange pas). – doug

+0

Allez-y :) J'utilise C++ pour mon moteur ANN. Merci pour l'aide copieuse :) – Micheal

2

Les réseaux de neurones sont assez résistants au bruit - qui est l'un de leurs grands avantages. Vous pouvez essayer de mettre des entrées à (-1.0,1.0) à la place, avec 0 comme entrée sans entrée, cependant. De cette façon l'entrée aux poids de ce neurone est 0.0, signifiant qu'aucun apprentissage ne se produira là.

Probablement le meilleur livre que j'ai jamais eu la malchance de ne pas finir (encore!) Est Neural Networks and Learning Machines par Simon S. Haykin. Dans celui-ci, il parle de toutes sortes de questions, y compris la façon dont vous devez distribuer vos intrants/ensemble d'entraînement pour la meilleure formation, etc. C'est un très bon livre!

+1

Cela ressemble à une bonne idée :) Je cherchais de bons livres sur ANN Depuis que je me suis intéressé pour la première fois ... Je suis en train d'accumuler une petite bibliothèque :) Je vais devoir regarder dehors pour celui-ci. Merci! – Micheal

Questions connexes