История изменений
Исправление victor79, (текущая версия) :
Но я в принципе не вижу смысла там делать не линейную ФА. За исключением случая, как я написал, когда распределение выходных обучаемых данных соответсуют этой функции, что в принципе крайняя редкость. А в остальных случаях это причина ухудшения сходимости сетки.
При этом тот крайне-редкий случай лучше преобразовать обучающие данные, и дальше использовать линейную ФА на последнем. Потому что это улучшит сходимость, потому что можно будет использовать линейный МНК для последнего слоя.
Исходная версия victor79, :
Но я в принципе не вижу смысла там делать не линейную ФА. За исключением случая, как я написал, когда распределение выходных обучаемых данных соответсуют этой функции, что в принципе крайняя редкость. А в остальных случаях это причина ухудшения сходимости сетки.