Избранное трейдера Виктор Громов
В этом году у меня своеобразный юбилей — 10 лет назад придумал и запустил первый портфель торговых роботов. Как вспомню те времена аж ностальгическая слеза наворачивается… Под роботов купил с рук отдельный компьютер, поставил в чулан, установил на него teamviewer для контроля с работы. Тогда в ЖЖ можно было почерпнуть много информации по алготрейдингу, тема была «на волне», много энтузиастов любителей писали интересные статьи с идеями и практически готовыми стратегиями. Что-то с тех времен даже до сих пор работает.. На моем веку с 2010 было как минимум 4 года, когда можно было удвоить депозит (2011, 2014, 2015, 2018) и это не считая текущего. Были и неудачные года с серьезной просадкой, сильно давившие на психику. Отключал торговлю я только раз на месяц в марте 2013, так сказать на пике своего эмоционального разочарования в алготрейдинге (хорошо потом переработав портфель и поразмыслив, перезапустил все обратно, следующий год «девальвации» и «Крыма» с лихвой отбил все предыдущие потери). Но не об этом. Решил я кратко и тезисно изложить проблемы, с которыми пришлось мне столкнуться за годы активного алготрейдинга.
Для численного моделирования переподгонки я взял дневки фьючерса на индекс РТС, с середины декабря 2006 по начало мая 2020, которые корректно склеены. Сначала рассмотрим систему максимальной доходности для 1 фьюча, торгуемого в обе стороны. Её эквити будет сумма модулей логарифмических приращений дневок, взятая нарастающим итогом. Финансовый «результат» 5207% (логарифмических), или 391% годовых. Число дневных баров 3356, коэффициент Шарпа с нулевым смещением (нулевой % ставкой) 9,8.
Наша «подгонка» будет состоять из 2 этапов. На первом мы моделируем наличие 3 индикаторов с порогом, просто присваивая каждому приращению случайное целое от 1 до 8, которое будет номером кластера. Напомню, что каждый индикатор с порогом делит массив баров на 2 кластера, а 2^3=8. На втором этапе суммируем дневные приращения внутри каждого кластера и приписываем кластеру позицию лонг, если сумма положительна и шорт, если отрицательна. Получаем эквити, для которой можно посчитать число сделок (перемен позиции), доходность, к-т Шарпа.
Из тестов которые я привел в прошлых постах, следует что для задач с ограниченной выборкой и моим виденьем рынка, следует использовать GB, как наиболее эффективный инструмент, далее близко идет RF, а а где то далеко позади, глотая пыль плетется нейросеть. Также следует необходимость чистки от левых фичей. В чем вообще вопрос?! Лишние фичи это возможность инструментам ML найти черную кошку даже если ее там нет, особенно феерически это показала нейросеть, которая при относительно небольшом числе примеров откровенно творит (от слова тварь). Давайте попробуем зациклить чистку фичей и сделаем это системно. Системно это в частности избежать заглядывание в будущее а танцев с бубнами. Мои данные это около 50 тысяч дневок для наиболее ликвидных российских фишек с 2010 по апрель 2018 года (2008 год безудержного падения, 2009 год безудержного роста, поэтому все что до 2010 года оставил за бортом, как заведомо простые для извлечения профита годы), заглянуть на них в будущее это в частности использовать для прогноза движения цен в 2011 году данные о ценности фичей за все года. Мы так делать не будем. Мы представим что переместились в начале 2011 года и имеем только данные за 2010 год. Для прогноза 2011 года используем данные о ценности фичей на тесте за 2010 год. Как используем? Да просто — из более чем трех десятков фичей используем только 5, 10, 20 наиболее информативных. Для прогноза 2012 года используем данные о ценности фичей на основе теста 2010-2011 годов итд. (Код разбухает, становится все менее читаемым, впору задумываться о ООП). После получения прогнозов, для удобство переведу их в столь любимое для трейдеров виде: профит на сделку, и сравню их с результатами если бы каждый раз использовались все доступные фичи. А их 34 штуки. Чистка фичей это будет во первых.
Во вторых попробую улучшить результат за счет скалерновской VotingClassifier, которая будет выводить нечто среднее из прогнозов RF и XGB.
Приступим с первого пункта.
Я попробую небольшими частями изложить основные положения обобщенной теории опционов. При ее разработке не использовалась гипотеза о случайном поведении цены базового актива по причине того, что для большинства финансовых рынков ее невозможно ни подтвердить, ни опровергнуть. Обобщенная теория индифферентна по отношению к причинам ценовых изменений и в этом ее отличие от классической теории опционов, для которой гипотеза о случайном поведении цен является незыблемым основанием. Важно отметить, что в случае согласия с гипотезой классическая теория не вступает в противоречие с обобщенной, но оказывается ее составной частью. Отсюда и название “обобщенная”. Она должна понравиться тем, кто не очень хорошо разбирается в методах ТВ и МС, но хочет разобраться в опционах.
Постараюсь обойтись минимальным количеством формул, хотя совсем без математики не получится. Поэтому, если что-то будет непонятно, спрашивайте.
Размещать новые части я буду с частотой примерно раз в неделю, по мере их написания. Всего частей будет, наверное, четыре или пять.
Что отличает трейдеров друг от друга?
Ну помимо вида функции эквити и ее параметров. Эта функция на первый взгляд кажется объективной. Но часто она может свидетельствовать только о попадании трейдера в удачную для него фазу рынка. Сменится фаза рынка и настанет «пичалька».
На самом деле важнейшей объективной характеристкой торговой системы и ее ядром является математически четко формализованная модель рынка.
Покажем влияние эффекта Даннинга-Крюгера на выбор моделей.
Как известно, эффект Даннинга-Крюгера заключается в том, что люди, имеющие низкий уровень квалификации, делают ошибочные выводы, принимают неудачные решения и при этом не способны осознавать свои ошибки и уровень некомпетентности (ВИКИ).
Кривая, отражающая этот эффект, показана на рис.1.
Почти все трейдеры начинают свой путь с моделей классического ТА (скользяшки, волны, свечи, паттерны, уровни и т.п.) или интуитивных моделей.
(информационно-просветительский текст о трейдинге – очень краткое теоретическое обоснованиеи указание на его тайный механизм, о котором многие не догадываются, а те, кто догадываются, часто неправильно понимают его сущность.
Но от степени понимания этого механизма и умения его использовать некоторые трейдеры, инвесторы, фонды зарабатывают очень прилично, другие - просто прилично, большинство — неприлично и основная масса торгующих организмов (кто не в теме) теряют депозит)
Если вам показалось, что вы меня поняли, то это значит, что вы поняли меня неправильно.
А.Гринспен
Честно говоря, не хотел это писать, но ведь все равно найдется «спиноза», который рано или поздно слегка просветит понимающую эту тему общественность.
Поэтому кратко только обозначим проблему
Сложился стереотип, что теория вероятностей – это человеческая наука о случайности. На самом деле это не совсем точно. Это математическая дисциплина, изучающая свойства вероятностных пространств. Что такое вероятностное пространство? Это человеческая математическая модель для случая, когда пока ненаблюдаемое является набором событий с некоторыми шансами их появления, как минимум, два из которых ненулевые. А что такое случайность? Это когда наше лучшее знание о пока ненаблюдаемом является набором событий с некоторыми шансами их появления, как минимум, два из которых ненулевые. Т. е. теория вероятностей занимается лишь изучением второй части из определения случайности и никак не доказывает и не опровергает гипотезу о нашем лучшем знании о пока ненаблюдаемом. Т. е. в основе теории вероятности лежит гипотеза об объективном существовании случайности.
И как определяется вероятностное пространство? А определяется оно исключительно в виде частного случая теории множеств, лежащей в основе всей современной математики. Откажитесь от теории множеств и вся современная математика рассыпается в прах.