Ответы на комментарии пользователя 3Qu

Мои комментарии:в блогах в форуме
Ответы мне:в блогах в форуме
Все комментарии: к моим постам
3Qu, так и я про это же, бро!

Обучение сетей прямого распространения — это метод сопряженных градиентов вместе с back propagation (ну это только для гладких пороговых функций)

Для негладких пороговых функций (sign) что-то умное из классики предложить сможешь? )))

С уважением
avatar
  • 03 декабря 2024, 22:47
  • Еще
3Qu, хммм

У меня Хайкин 2012 английское издание с дополнениями

Математика после этого не изменялась
Появились трансформеры и прочая шляпа

С уважением
avatar
  • 03 декабря 2024, 22:37
  • Еще
3Qu, по классике (нейробиологи) — именно sign

А уже лет через 20 инженеры, которые только и умеют, что дифференцировать, стали заменять пороговую функцию на сигмоиду )))

 Суважением
avatar
  • 03 декабря 2024, 22:36
  • Еще
3Qu, бро

Это было 2 разных вопроса. Если конкретно
1. Никто не умеет обучать модели с негладкими пороговыми функциями. При несогласии — расскажи про обучение для sign
2. Все умеют обучать с гладкими пороговыми функциями. Но никто не заморачивается оценкой разницы экстремумов при замене sign на tanh

С уважением
avatar
  • 03 декабря 2024, 22:30
  • Еще
3Qu, уважаю твою вечнопозитивную точку зрения

Возьмем простую прямую сетку для глубокого обучения с N скрытыми слоями
Поставим (по классике) пороговую функцию sign

Приведи мне хотя бы одну ссылку на метод оптимального расчета коэффициентов для такой модели.

Ну или приведи мне хотя бы одну ссылку для оценки разницы экстремумов между моделью с sign и моделью с tanh.

С уважением
avatar
  • 03 декабря 2024, 22:26
  • Еще
3Qu, +85% (BitMEX, с НГ)

Я не учился нейросетям, но прочитав недавно пару умных книг (Гудфеллоу и Хайкин, в них хоть формулы какие-то есть) внезапно понял, что в этом подходе есть некая идея.

Но есть нюансы.

1. Если мы заменяем пороговую функцию с sign на tanh, то сетка ничего путного наваять не может
2. Если мы оставляем пороговую функцию sign, то результат получается шикарный

Проблема в том, что (судя по публикациям) практически никто, кроме меня, не умеет решать задачи нелинейной оптимизации с негладкими пороговыми функциями )))

Не торопись, бро. Дай мне еще месяц до начала января — попробую собрать все в кучу и опубликовать подробный пост. Материалов много, а работы до НГ — еще больше (((

С уважением
avatar
  • 03 декабря 2024, 22:12
  • Еще
3Qu, почему?

Есть чем.

В моменте пишу большую статью, что ни ты, ни А.Г. не умеют говить нейросети к предсказанию приращений рыночных цен )))
А так — п@здобольство на СЛ достало. Пишу человеку вежливо — перестань, плз, писать про меня инсинуации. А он мне в ответ — а я так думаю, ты что, мне рот затыкаешь? Детский сад, младшая группа...

Как сам?

С уважением
avatar
  • 03 декабря 2024, 22:04
  • Еще
3Qu, блажен, кто верует, тепло ему на свете.
avatar
  • 03 декабря 2024, 15:56
  • Еще
3Qu, он в отпуске
avatar
  • 03 декабря 2024, 01:49
  • Еще
3Qu, вы идете от прогноза.
а современные большие сетки диффузионные могут идти от сделок прогнозируя СДЕЛКИ похожие на sample.

с следующие 5 минут все отлично кроме того что комиссия спред и проскальзывание все сожрет.
там все время будет кто-то быстрее вас который арбитражит например тики.
и железо у него на самой бирже.

а на большие периоды прогноз резко ухудшается.

из прогноза цены делать алго это сложно.

avatar
  • 03 декабря 2024, 01:28
  • Еще
3Qu, это могут быть сделки с ЛЧИ)
ЛЧИ такая-же разметка.
или вон в финаме те кто в плюс торгуют.
avatar
  • 03 декабря 2024, 01:10
  • Еще

3Qu, таким образом вы просто переобучаете модель и она запоминает фактически весь график... 

а должна паттерн.
цель обучения не максимум доходности а повторить похожий на пример паттерн.

график не такой большой и современные гигабайтные нейросети его тупо запоминают ЦЕЛИКОМ.
переобучаются.

avatar
  • 03 декабря 2024, 01:09
  • Еще
3Qu, обучаю именно диффузионные модели, а не классификаторы.
ну как модели… микро модельки…
avatar
  • 03 декабря 2024, 01:06
  • Еще
3Qu, а я думаю что поток сделок это та самая разметка которая должна быть на обучении.
а авто генерируемые разметки не работают в llm моделях и в диффузионных тоже.
это уже проверено.

обученные на авто генерируемых разметках сети качественно хуже, а не лучше.

как размечали на картинках объекты сотни тысяч объектов.
потом размечали тексты.

понимаешь в атогенерируемой разметке НЕТ никакой неэффективности и никакой торговой идеи, и по этому искать там ее нейросетями бесполезно.

другое дело поток доходных сделок вместе с убыточными! но по тому-же паттерну.
обучает нейросеть паттерну.

avatar
  • 03 декабря 2024, 01:01
  • Еще
3Qu, дневки нестационарны даже в течении месяца в 90%+ случаев, а про другие приращения цен ничего сказать не могу.
avatar
  • 03 декабря 2024, 00:44
  • Еще
3Qu, 
Кстати, вы при каждом входе в сделку меняете логику ТС? А следовало бы, ведь рыночные ВР нестационарны.)

В моей ссылке прямо написано, что в разные моменты времени используются индикаторы с разным окном расчета.
avatar
  • 03 декабря 2024, 00:26
  • Еще
3Qu, 
Для НС, в частности, нет требований к стационарности. У классиков это явно написано.

Эти требования для входов любых самообучающихся алгоритмов математиками доказаны еще в 70-х годах 20 века. Не понимаю, почему незнаек математики Вы называете «классиками».
avatar
  • 03 декабря 2024, 00:01
  • Еще
3Qu, под настроение и для азарту на чуть использую
иногда 
новичкам  рекомендую для опыта 
avatar
  • 02 декабря 2024, 20:54
  • Еще
3Qu, вкус чистой водки это точно скрепа русского рода
это святое
не буду
как то пил для пробы кошерную водку 
норм была 
avatar
  • 02 декабря 2024, 20:30
  • Еще
Выберите надежного брокера, чтобы начать зарабатывать на бирже:
....все тэги
UPDONW
Новый дизайн