Contrairement à la régression linéaire et logistique, les fonctions de coûts ANNs ne sont pas convexes et sont donc sensibles aux optima locaux. Quelqu'un peut-il fournir une intuition pour expliquer pourquoi c'est le cas pour les RNA et pourquoi l'hypothèse ne peut pas être modifiée pour produire une fonction convexe?Pourquoi les réseaux neuronaux ne sont-ils pas convexes?
0
A
Répondre
0
J'ai trouvé une explication suffisante ici:
https://stats.stackexchange.com/questions/106334/cost-function-of-neural-network-is-non-convex
Fondamentalement, puisque les poids sont permutables à travers les couches, il existe de multiples solutions pour tout minima qui permettront d'atteindre les mêmes résultats, et donc la fonction ne peut être convexe (ou concave non plus).