3Qu, так и я про это же, бро!
Обучение сетей прямого распространения — это метод сопряженных градиентов вместе с back propagation (ну это только для гладких пороговых функций)
Для негладких пороговых функций (sign) что-то умное из классики предложить сможешь? )))
С уважением