Т.е. закономерно, что туда кто-то попадет, закономерно какая доля туда примерно попадет. Но закономерно и то, кто куда попадет.
Речь, понятно, о распределениях случайной величины. Чтоб не уходить в абстрактные дебри (с риском потери нити) сразу на примере. Случайная величина – среднегодовая доходность трейдера через 5 лет торговли.
Просто часто слышу, что постоянно все списывают на ошибки выжившего, на распределения. Из 1000 фондов 3 перформят очень хорошо, а в среднем 1000 очень даже хреново – ну эти парни случайно попали в хвост, через пару лет на их месте будут другие. Несколько чуваков отлично торгуют руками – ну, нет смысла даже смотреть что они делают, случайно залезли в хвост, ошибка выжившего – мы на это не купимся, не будем смотреть что и как они делают.
Булщит по-моему.
Распределения случайной величины выглядят так (нормальное распределение, например) не просто так. Можно взять простую модель и разложить результат как совокупность влияния факторов. Так вот если все факторы складываются хорошо, то и результат скорее всего будет хороший и результат попадет в положительный хвост. Так вот эти самые факторы обычно вполне себе контролируемые вещи. В нашем примере с трейдером, если чел четко анализирует обратную связь и улучшается на основе нее (один фактор), не глуп (другой фактор), имеет некоторый благоприятствующий психотип (ещё фактор) и т.д., то он, конечно, может попасть в самое любое место распределения, но мат. ожидание все-таки будет прилично смещено относительно общей выборки.
Придумал интересный подход. Мож кого натолкнет на интересные идеи какие-то.
Сейчас начал торговать ML модели. С практической стороны с моделями какая сложность – там есть процесс предобработки данных – генерация признаков в основном (если с точки зрения трейдинговых данных заходить), поэтому нельзя просто сохранить модель, в другом месте загрузить и она будет работать, надо сохранить, загрузить, предобработать исходные данные к тому виду, к которому приучена модель и только тогда она будет работать. К счастью тонна сопутствующих трудозатрат убирается такой классной штукой как пайплайн – сейчас моя модель это 2 пайплайна – один для предобработки данных, другой для предикта (сама модель). Т.е. я где-то что-то рисечу, дальше автоматика упаковывает в пайплайны (2 на модель, как сказал). Все, могу кинуть эти 2 файла в папку с моделями, откуда их забирает торгующий блок и, собственно, отторговывает. Красота. Всякие мета-данные – тикер там, время удержания позиции и прочие мета-логики упаковываю или в сам пайплайн или в название файла. Красота.
Берём 2 эквити:
1. Плавный рост, доходность 15% годовых.
2. Ступенчатый рост (рывок-плато-рывок-плато), доходность 40% годовых.
С точки зрения коэффициента Шарпа, какая предпочтительнее?
Можно ли вообще примерно прикинуть Шарп по форме эквити?
Неоднократно попадались такие споры в комментариях:
«Я проверял на прошлых данных такую-то стратегию или семейство стратегий — она не работает».
«Я тоже проверял — всё работает».
То есть, мы имеем разных людей, делающих проверки на истории одного и того же, и уверенных, что всё делают правильно, но получающих разные, а иногда и противоположные результаты.
Получается, мы выходим на такие темы как:
1. Разные методологии проверки на прошлых данных.
2. Разное качество такой проверки, зависящее от знаний проверяющего.
Значит, нужно вывести идеальную модель бэктестинга, строго её описать и сверять все проведённые бэктесты с этой моделью.
И ставить алготрейдерам оценки от 1 до 5, в зависимости от соответствия проводимых ими проверок идеальной модели.
Вопрос: вывел ли уже кто-то такую идеальную модель бэктеста?
И где её найти?
Начнем с традиционной таблицы
Писать особо нечего, из таблицы видно, что «пилилось» все. Все позиции и даже RI-контртренд в июне в минусе. Первые три дня июня, в которые «отбились» минусы мая, подарили надежду на лучшее, которая, однако, быстро «испарилась» в следующие два дня. Неприятность в том, что нынешняя просадка с 09.04, хоть и меньше мартовской, отраженной в графе Максимальная просадка, но происходит на фоне резкого снижения волатильности, что делает перспективы быстрого выхода из нее туманными.
Доходность стратегии Стань квалифицированным инвестором! в июне составила -2.4%, что аналогично Спот+ «синтетика».
«Русский Баффет» июнь также закончил в минусе (удивительно, но тоже -2.4%), в отличии от индекса Мосбиржи. Его состав во втором квартале 2020 был
Все-таки все люди супер разные, очередной раз убеждаюсь. Даже вот когда речь заходит о рисечах и бэктестах.
Сразу скажу, что это не полноценная исчерпывающая классификация, а всего лишь набор некоторых архетипов, не исчерпывающий набор и, возможно, не самые типичные архетипы даже.
И да, все персонажи вымышлены, все совпадения случайны))).
Архетипы алготрейдеров:
1. Просеиватель. Прочесывает все что можно в поисках простых, но ± законченных идей, берет, идею, тестит, выкидывает если не работает, ищет дальше, способен генерировать идеи и сам, работает с идеями в таком же ключе. Считает, что успех в том, чтобы просеять как можно больше простых идей, чтобы именно за счет этого найти большое число интересных идей.
2. Мега-мозг — перелопачивает тонны литературы, исследований, знает сто-пицот математических методов, теорем, вероятностных распределений. Среди знакомых ему формул, теорем и распределений, вероятно, даже встречаются те, где в названии не две фамилии, а 3, но это не точно. Считает, что успех в том, чтобы быть на острие научного прогресса, поглощать передовые исследования.
Начнем с традиционной таблицы
Первые две декады мая меня откровенно «пилило». Началось все с «распила» в Si 4-5 мая, после чего он был «вырублен» «фильтром большой пилы» до конца мая. 6-7 мая «эстафету принял» RI-тренд и его майский убыток почти в 1,5 раза меньше убытка в эти два дня. И закончилось все большим убытком RI-контртренд 18-20 мая, который, впрочем, этой системе удалось сократить больше, чем в 2 раза до конца мая.
Но были и приятные моменты: с 12 по 18 мая была традиционная «кошмарная неделя» ( 4 сильных гэпа против движения предыдущего дня), которая встречается по статистике 1-3 раза в год. Но «фильтр короткой пилы» в этот раз позволил мне в эти дни избежать больших убытков, встречавшихся до его создания. Поэтому максимальная просадка в этом году осталась без изменений.
Спокойнее всего в мае вели себя Спот+ «синтетика», закончившие 4-19 мая в легком минусе и получившие прибыль по итогам месяца.
В алготрейдинге считается почти общим правилом, что нужно проверять все создаваемые ТС на истории. Но иногда возникает подозрение, что в этих проверках на истории есть существенная доля самообмана.
Какие ловушки могут поджидать нас на этом пути:
1. Нарушение самой методологии проверки на истории (по незнанию или из-за собственных предпочтений, ошибочность которых неочевидна). Это относительно легко устранимая ошибка.
2. Нарушение методологии проверки отдельной стратегии (не учитываем её особенности). А вот эту ошибку устранить уже на порядок сложнее.
3. Незнание неких особенностей работы рыночной инфраструктуры, которые могут повлиять на различия в работе исследуемой ТС сейчас и в прошлом.
Например, известны многие случаи, когда ТС работает на истории, а на настоящих торгах уже не работает. Все такие случаи связаны с вышеперечисленными 3 причинами. И из этого же следует, что среди проверенных на прошлых данных и отброшенных как неработающие ТС скорее всего было множество производительных, но их не разглядели и выбросили (такие и у Вас есть; да, да, не удивляйтесь, а лучше переберите заново то, что когда-то выбросили и поглядите на это свежим взглядом).