Блог им. Replikant_mih

ML в трейдинге, причины эффекта падения метрики качества с ростом вероятности.

К предыдущему посту с тоже конкретным ML вопросом получил отличный фидбек от толковых комментаторов, превзошло мои ожидания, очень круто, ещё раз всем спасибо! 

Уверен, что и по этому вопросу людям будет что сказать.


В общем использую ML для нахождения закономерностей в осмысленных признаках — так можно кратко описать мой подход). Так вот часто наблюдаю такие эффекты и не сформировал пока четкой позиции по их интерпретации, возможно, кто-то в эту сторону уже копал и как-то дальше продвинуться, буду рад почитать какие-то инсайты или просто рассуждения на эту тему. Добро пожаловать в комментарии опять.


Суть явления: всегда оцениваю зависимость между метрикой качества сигналов и вероятностью, выдаваемой моделью по сигналу. Хорошие признаки хорошая модель построит монотонно растущую зависимость. Может быть хаос вместо монотонного роста — значит модель не вывезла — или модель не алё, либо признаковое описание не але, либо слишком много признаков для такого кол-ва данных и т.д. Но часто даже если видно, что модель нащупала смысл в данных, начиная с какой-то вероятности наблюдаются разные явления.

А именно:

1. Начиная с некоторой вероятности, метрику качества начинает колбасить из-за того что кол-во случаев падает значительно. Тут все понятно, выборка становится нерепрезентативной, колебания объяснимы — вопросов нет. 

2. Закономерность явная, монотонность четкая, но на самых высоких значениях вероятности график зависимости начинает по непонятным причинам загибаться вниз, в отличии от (1) репрезентативность там нормальная, т.е. это не похоже на загиб связанный с нерепрезентативностью. Думал-думал, придумал возможное объяснения — такие ситуации на рынке выглядят для участников как верняковый верняк — все карты сходятся, вероятно или манипуляторы используют эту повышенную «верняковость» для развода толпы, либо — если без теорий заговора — эта же избыточная верняковость сама за счет естественных каких-то механик играет наоборот. 

Но, возможно, эти объяснения ни о чем и есть причины совсем другой природы. Что думаете?

3. Каким бы ни было «пустым» признаковое пространство, каким бы эффективным не был рынок, на котором тестишь, почти всегда сначала (на графике зависимости целевой метрики от вероятности, выдаваемой моделью, напомню) видно, что модель что-то нащупала и график начинает монотонно расти, но в какой-то момент опять начинается хаос. Этот не сильный, но рост графика выглядит закономерным — слишком часто это вижу и слишком явно это выглядит, но потом начинается хаос (опять таки на нормальных выборках, не про нерепрезентативность). Отличие от (2) — то что это более мимолетная схваченная связь и довольно быстро она пропадает. Тут я вообще теряюсь в догадках и не придумал, как интерпретировать.


Зачем этот вопрос и зачем исследовать эту зависимость в принципе — это ответ на вопросы:

— Сравнение моделей/стратегий между собой, сравнение разных таргетов, признаковых описаний, гипер-параметров модели и т.д.
— Оценка робастности.
— Оценка качества закономерности в целом.
— Наверняка, если понимать, причины поведения графика зависимости метрики от вероятности, можно осмысленно задействовать какие-то рычаги для улучшения модели!

В общем если есть что сказать по теме — добро пожаловать в комментарии!


P.S. Зависимость эту строю всегда на OOS.
32 комментария
звучит красиво. Просто любопытно удалось найти хоть одну tradeable закономерность, которая не описана как stylized fact (и является одной из стандартных risk premiums)? 
avatar

wrmngr, Не знаю, что имеется в виду. Я, если честно, не очень люблю классификации и сам найденные закономерности не классифицирую, тем более через призму каких-то общепринятых классификаций. 

По сути тут ML просто автоматизация + чуть больше гибкости, а на вход я подаю осмысленные признаки, из которых я б и так классическими способами извлек закономерность, которую бы торговал в форме обычных rule-based алго-стратегий.

avatar
Replikant_mih, При таком подходе есть серьезная опасность получить набор разных на первый взгляд паттернов, но которые будут сонаправленны по риск-факторам и это не очень хорошо
avatar
wrmngr, Типа модели будут давать высококоррелированную эквити? — Есть такой риск, после добавления ML слоя в сбои процессы глубоко этим вопросом ещё не занимался. Ну как минимум не пихать во все модели одинаковые признаковые пространства)). Ну и постфактум отобранные модели чекнуть на корреляцию по тем же принципам, что и обычные стратегии.
avatar
Replikant_mih, корреляции по эквити это вершина айсберга. Нужно понимать чувствительности портфеля к разным параметрам. А в такие блекбоксах это неочевидная вещь
avatar
wrmngr, Типа все модели от лонга торгуют, поэтому на падающем всему пулу будет хреново или всем на высокой воле хорошо, на низкой всем будет плохо — про это?
avatar
Replikant_mih, да, это, но чуть более общий уровень — чувствительность к изменению ставок денежного рынка например или внезапному джампу цены, режиму волы. В общем разные греки + макрофакторы +микроструктурные эффекты
avatar
Replikant_mih, и разбиение на типы признаков здесь не особо помогает
avatar
wrmngr, Использование классических стратегий само по себе автоматом тоже от подобного не спасает, нужен отдельный слой анализа, который будет этим будет заниматься и тут не принципиально — классические стратегии у тебя или ML модели. 
avatar
Replikant_mih, не спасает конечно, но когда правила явным образом заданы, то все понятно по рискам
avatar
wrmngr,

Просто любопытно удалось найти хоть одну tradeable закономерность, которая не описана как stylized fact (и является одной из стандартных risk premiums)?

Если pattern и найдена, то the author она unlikely будет distribute всем free.
avatar
A2format, Школа вспомнилась, когда на каникулах книжки по программе читал, а там любили классики всякие подобные штуки тока на французском вставлять). Очень бесило)).
avatar
A2format, я и не прошу full disclosure, токмо сам факт наличия obviously
avatar
wrmngr, Да, of course.
avatar
оцениваю зависимость между метрикой качества сигналов и вероятностью
разве это не одно и то же по смыслу?
avatar
Sergey Pavlov, вероятность, выдаваемая моделью для сигнала — это то, как модель оценивает сигнал. А метрика качества сигнала — это то какой он по факту получился в итоге. Конечно, на выборке, а не для одного сигнала), PF для одного сигнала не посчитать).
avatar
Sergey Pavlov, Другими словами, у хорошей модели, её уверенность в будущем трейде должна хорошо коррелировать с фактическими результатами этих трейдов.
avatar
Сергей Сергаев, вот да, можно к примеру сделать short-vol trade (с целью сбора variance risk premium) тысячью разных способов на разных инструментах, но итоговый результат будет почти неотличим по risk-adjusted метрикам на дистанции
avatar

Ты наверняка про дисперсию забыл. Всегда есть две чиселки — матожидание и дисперсия, ты смотришь только на оценку матожидания и радуешься что она у тебя выросла условно в 4 раза, а оценка дисперсии (и дисперсия оценки) в то же самое время могла вырасти тоже условно в 40 раз.

Пафос Респектыч, Мм, да, надо попробовать явным образом это смотреть, спасибо.

Но все-таки это позволит более точно описать, что происходит. Но остается открытым вопрос: почему) — я про описанные эффекты. И думаю, в ответе на него хранится много полезной информации.
avatar
Replikant_mih, что почему, очень просто — у точек с большой доходностью дисперсия больше, там волатильность больше, колбаснуть может как в одну так и в другую сторону, процесс-то случайный ) да и точек таких меньше как ни крути.
Пафос Респектыч, Точек меньше да, но тем не менее, на некоторых моделях этого не наблюдается и не наблюдается не случайно (если пошевелить признаковое описание или период чуть другой взять — картина не меняется). Т.е. это скорее про описанный мной вариант (1), но не (2), (3).
avatar
Может, Вы используете и стандартные метрики, но хотелось бы понять, какие именно. 
avatar
SergeyJu, для зависимости вероятность сигнала — метрика? Метрикой выступает winrate или PF, пока только эти смотрю.
avatar
Replikant_mih, это не статистические метрики, ты вообще не туда смотришь )
Пафос Респектыч, Не статистические, но и я не Росстат, а трейдер)), И чем статистические метрики лучше? Ну возьму я средний трейд (или статистическое мат. ожидание) — оно будет офигеть какое статистическое, что мне это даст?
avatar

Replikant_mih, да какой ты трейдер, не смеши )

Прежде чем строить на основе модели ТС, тебе надо убедиться что твоя модель вообще работает, чисто с математической точки зрения. Для этого считают всякие показатели ошибок, статистические тесты смотрят, статистическую значимость, вот это вот всё. Потому что если у тебя сама модель не работает, то ТС на её основе будет торговать случайно.

Все элементы ТС из которых она состоит должны быть работоспособны и проверены по отдельности ещё до того как их собирать всех вместе и смотреть что получается, иначе можно бесконечно этим заниматься, то вроде работает, то ой хаос. Ну такое.

Пафос Респектыч, Интересная, конечно, картина мира. У всех вокруг всё не работает). Или это только у тех кто вопросы задает? Типа доброта — признак слабости, вопросы — признак того, что ничего не работает?)

Всё работает, и будет работать ещё лучше, для этого и развиваюсь, исследую и интересуюсь.
avatar
Replikant_mih, можешь именовать себя трейдер-энтузиаст так и быть )
Replikant_mih, по winrate и PF стратегия B&H (ну или иногда short & hold) абсолютно непобедима. Может стоит что-то другое использовать?
avatar
Кирилл Гудков, Есть такое, но пока я таргетом использую удержание 20 свечей, поэтому все стратегия равны и тех показателей, что стратегии с длинным удержанием по PF и winrate не получишь за счет чего-то кроме реального эджа. Но я ещё экспериментирую, думаю, и другие метрики задействую в экспериментах.
avatar

теги блога Replikant_mih

....все тэги



UPDONW
Новый дизайн