Replikant_mih
Replikant_mih личный блог
25 января 2024, 19:14

ML грааль в трейдинге.

Взяли в руки блокнотики?))

 

Грааль в ML для трейдинга состоит из нескольких компонентов. По сути грааль, это «правильные» ответы на вопросы:

  1. Что используется в качестве объектов, на которых мы обучаемся. Что за срез. Что? – Свеча, день, тик, трейдер, стакан, паттерн? Очень важный компонент.
  2. Признаковое описание этих объектов. Супер-важная тема. Пространство для креатива.
  3. Таргет – важная тема, но скорее производная от «что является объектом». После выбора объекта, с таргетом становится ± понятно.
  4. Тип модели. Эта штука, на самом деле не так и важна, как кажется.
  5. Параметры модели (гиперпараметры и вот это вот всё). Из одних гиперпараметров кашу не сваришь, их нужно использовать скорее чтобы «не испортить блюдо».
  6. Процесс. Обучения, отбора, валидации модели. Супер-важная тема тоже.

 

Пожалуй, можно составить ТОП покороче:

  1. Что является объектом.
  2. Признаковое описание.
  3. Процесс отбора данных, обучения, отбора, валидации моделей.

 

Да, этот ТОП3 хорошо отражает мой опыт использования ML в трейдинге.

33 Комментария
  • Beach Bunny
    25 января 2024, 20:30
    Если хочешь грааль то тренировать надо как автопилот или в game-песочнице, при удачной тренировке получится хороший робот трейдер.
    А при использовании того что ты описал — получишь прокачанную версию линейной регресии, что наверно неплохо, но врядли то что тебе надо.
      • Limitador
        25 января 2024, 21:05
        Replikant_mih, всё понятно
  • NOT A HAMSTER
    25 января 2024, 21:21
    Природа это  природа, потому что если бы она не была природой, то и природы бы не было вовсе. А поскольку природа, была всегда природой,  то  она по сути и есть сама природа. 
  • Гуру Хренов
    25 января 2024, 22:37
    они думали, что поймали бога за хвост, a на самом деле это была бета на растущем рынке
  • Пафос Респектыч
    25 января 2024, 23:20
    Где-то рядом с такими граалями живут марафоны желаний и тренинги личностного роста )))
      • Пафос Респектыч
        25 января 2024, 23:58
        Replikant_mih, ещё розовые пони, которые какают радугой )
  • DV_13
    26 января 2024, 10:01

    Добрый день!
    Если потратить 10% усилий на математику и физику вместо ML — все станет проще и понятней.

      • svgr
        26 января 2024, 11:30
        Replikant_mih, с моей точки зрения, смысл предварительной математики в том, чтобы задать точки где копать и отсечь явно лишнее. То, что явно знает математика, надо использовать. Пример — линейная регрессия. А там, где она не имеет точного решения — сетки.
        Не секрет, сто chatGPT откровенно слаб в решении математических задач. Он выдаёт пургу в задачах, имеющих точное решение. То, что он выдаёт, даже нельзя назвать приблизительным решением.
          • svgr
            26 января 2024, 13:13
            Replikant_mih, просто имейте в виду, что сейчас называют машинным обучением, когда-нибудь систематизируют, структурируют, опишут закономерности и внутренние взаимосвязи, и назовут новым разделом математики.
            А если вспомнить личное прошлое, то в 90-е мой приятель на физфаке МГУ занимался распознаванием образов. То есть строго в рамках научного подхода.
              • svgr
                26 января 2024, 13:39
                Replikant_mih, когда раздел науки сформируется, появятся готовые решения, подходы и т.п. для основных типовых вопросов. Станет проще и быстрее всё применять. Вот на это влияет.
  • DV_13
    26 января 2024, 10:38

    Есть разные типы развития — гуманитарные (типа литература, языки, ...),
    а есть 'суровые науки'. где есть причинно-следственнаяся связь.
    Я думаю, что ML — ближе к гуманитарным. Результат получается за счет анализа большого перебора комбинаций. Что, в общем, тоже не плохо, вычислительные мощности растут.

  • Synthetic
    26 января 2024, 16:14
    На мой взгляд, ML pipeline, как сейчас говорят, начинается с модели событий. Модель определяет, что является объектом, и как и что с чем должно быть связано. Например крайне распространенная вероятностная модель ( приращения цены -независимый случайный процесс и т.д. и т.п. ) очень быстро приведет Вас в тупик.
    Далее следует важнейший этап — векторизация. В результате получаем эмбеддинги — векторное представление данных, которое при удаче отражает смысл происходящего. Надо четко понимать, что без этого этапа никакой ИИ невозможен.
    Далее практически все уже стандартизовано и конвейеры налажены. Тип сети, гиперпараметры, обучение. валидация — все уже предельно разжевано и большая часть кода уже написана. Надо только подобрать подходящий вариант.
  • Synthetic
    26 января 2024, 16:52
    Векторизация — как раз это для меня выглядит формальностью и просто техническим моментом
    Гигантская ошибка.
    Приведу избитый пример правильной векторизации (типа той, какую делает, например Word2Vec.)
    Каждому слову или последовательности слов сопоставляется вектор одинаковой длины (длиной 1000+-500).
    Возьмем четыре слова:
    король
    королева
    мужчина
    женщина
    Соответственно получим четыре вектора.
    Произведем простейшую математическую операцию над векторами(они все одинаковой длины).
    Вектор_искомый=вектор_король — вектор_мужчина + вектор_женщина.
    Полученный вектор сравним ( операция называется — вычисление косинусной близости)с вектором королева. Оказывается это почти одно и тоже. Т.е. мы еще не начинали собственно обучения, а в эмбеддингах уже полно смысла!
    Если вместо «правильной» векторизации использовать что попроще — например «мешок слов» — ничего хорошего не выйдет. И никакая супер-пупер нейронная сеть этого уже не исправит.
  • Synthetic
    26 января 2024, 17:24
    Машины вообще не работают со словами ( в человеческом понимании, в машинном понимании слово — это два байта). Они работают с битами, байтами. А как интерпретируются эти байты — как слова или как табличные данные их совсем не волнует. В любом случае исходные данные для подачи на вход нейронной сети должны быть векторизованы. И это крайне чувствительная процедура. Если Вас не устраивают векторы и тензоры, Вам придется придумать свое глубокое обучение с нуля.
  • Vladimir Iastrebov
    11 марта 2024, 10:50
    У меня на данном поприще получилось нечто следующее:

    Задаются метрики качества выше которых модель берется в оборот. Одной метрикой не справится, идут несколько. PF>3 KR>30 W>0.5 Средний трейд и к-во трейдов — по обстоятельствам.

    Выжившие попадают к господину Шарпу. Или Сортино, если трейдов много.

    Из кастомных. Коэффициэнт деградации подхода.Пример: Пеформанс последнего года/ Перворманс предпоследнего.
      • Vladimir Iastrebov
        11 марта 2024, 18:52
        Replikant_mih, Подход к разгребанию IS который оказался стабильным

      • Vladimir Iastrebov
        11 марта 2024, 18:52
        Replikant_mih, :) спасибо. Осматриваюсь. Знакомые все «лица» :)

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн