Блог им. Kot_Begemot
Часть 2.
В прошлой части мы подбирали такую комбинацию статистических оценок динамики акций, которая давала нам возможность стабильно выбирать портфель акций лучше среднерыночного, с показателем Шарпа на 26% выше индексного.
Мы также пробовали составлять портфель из портфелей и портфель на основе портфеля оценок, но в силу высокой линейной зависимости оценок и полученных на них портфелей друг от друга Bagging ожидаемо не дал никакого результата.
Тем не менее, этот важный этап подготовительных работ – построение портфеля (или композиции портфелей) на простых, статистических оценках дал нам некоторую отправную точку, относительно которой мы будем рассматривать эффективность всех наших последующих нововведений.
Рис. 6. Иллюстрация динамики волатильности акций США, входящих в состав индекса S&P 500.
Основную проблему стандартных методов мы видим в том, что они разработаны для стационарных стохастических процессов, в то время как любые финансовые (а зачастую природные, биологические и др.), временные ряды имеют нестационарную природу. Так, например, широко известно, что логарифмическое изменение стоимости акций является нестационарным процессом со склонностью к консолидации (кластеризации) волатильности.
В финансовой математике для описания подобного рода явлений широко используются различные авторегрессионные модели – ARCH, GARCH и прочие. Что вполне естественно, так как любая AR модель, например, простая синусоида, будет обладать вышеупомянутым свойством кластеризации.
В этом смысле, вполне естественно, что статистические оценки для подобных нестационарных рядов, полученные средствами, заточенными под ряды стационарные (с постоянной волатильностью), будут сильно искажены, а результаты их применения будут бесполезны. (Простейший портфель показал результаты на валидационном тесте даже хуже среднерыночных)
При этом одних только авторегрессионных моделей волатильности существует порядка сотни, а наряду с ними желаемые распределения с «тяжёлыми хвостами» можно получить с помощью моделей случайной волатильности, например, подбрасывая монетку со случайной ставкой и ещё целого ряда различных методов.
Таким образом, имея такой широкий спектр разнообразных моделей (если они действительно достаточно разнообразны и, соответственно, линейно независимы) мы можем рассчитывать на то, что композиция (Bag/Boost) этих моделей будет обладать намного более высокой обобщающей способностью (прогностической силой), чем каждая из них в отдельности.
Следуя этим рассуждениям, мы подготовили базис из около 50 различных методов оценки риска, доходности и корреляции, учитывающих нестационарность финансовых временных рядов различными способами – от AR-процессов, до оценки рисков по Сортино, – на основе которых впоследствии был построен ряд наиболее устойчивых композиций.
Такой подход позволил нам добиться значительного улучшения показателя Шарпа на рынке NASDAQ по сравнению с портфелем, составленным из простой комбинации простых оценок, но, к сожалению, при линейном переносе полученной композиции на рынок акций ММВБ мы получили далеко не самые лучшие результаты. При этом, новая композиция, заточенная под рынок ММВБ, пересекалась с композицией, заточенной под рынок NASDAQ всего на 30-40%. Что говорит о ещё недостигнутой универсальности методов.
Продемонстрируем полученные результаты на примере 24 голубых фишек, входящих в индекс ММВБ:
Рис.7. Точечная диаграмма голубых фишек ММВБ в плоскости доход/риск за последние 7 лет (24 фишки).
На графике дополнительно изображена апостериорная эффективная граница портфелей Марковица (синяя кривая), «робастная» апостериорная граница с фильтрацией случайных колебаний доходности (пунктирная) и Security Market Line (красная) в виде линейной регрессии по собственному риску.
На этих данных мы построили ряд портфелей, каждый из которых имеет только три экзогенных переменных (входные параметры) – длинна обучающей выборки, уровень сглаживания (если оно применяется) и оптимальный инвестиционный срок (частота пересмотра портфеля):
Рис. 8. Демонстрация динамики ликвидационной стоимости портфелей.
Рис. 9. Демонстрация динамики ликвидационной стоимости портфелей в логарифмическом масштабе. В качестве особых точек выделены точки, соответствующие максимальной просадке индекса и Boost портфеля.
Табл. 2. Статистические характеристики полученных портфелей и предполагаемая максимальная просадка на уровне трёх сигм.
В качестве текущих проблем мы видим:
Рис. 10. Корреляция доходности Boost портфеля и индекса iMOEX.
Обычно корреляция снижается путём покупки 20-40% облигаций, но это говорит не о качественном решении задачи управления портфелем ценных бумаг, а об отсутствии такового.
Рис 11. Демонстрация динамики относительных весов активов в Boost портфеле. Время отложено по оси ординат (сверху-вниз), активы – по оси абсцисс.
Видно, что Boost портфель на 80% своего состава преимущественно выбирает две-три, наиболее доходных, некоррелированных акции (из 24), лишь изредка прибегая к концентрированным вложениям в один актив.
ужас
портфелем туда, портфелем сюда...
а потом рынок тебе впендюрит.
мужики, которым дали нобелевку по экономике, тоже думали, шо они круто портфэли составляют. пока не пришёл 2008 год. там они свой фонд с портфэлями и просрали.
Лауреат Марковиц управлял инвестициями в Фэнни Мэй и там тоже всё навернулось. Вопрос, почему великие гении экономики не могут успешно применить свои теории на практике? Ответ, потому что рынку похер на модели этих «гениев».
А вот LTCM, это более поучительная история для статарбитража вообще, но никак не для портфеля.
прекрасная логика!
Нам, трейдунам, которые сравнивают свои доходности с инвест.портфелями, очень полезно всякое такое для личностного роста. Всё время собираюсь начать накапливать акции. Вот уже скоро!
Не пытайтесь заниматься самообманом и делать вид, буд-то какая-то математика или какая-то логика (а следовательно какой-то метод, какая-то ТС) не являются подгонкой. Все это выдуманные, нереальные объекты подогнанные под действительность. Разница лишь в том, что подгонять можно качественно, а можно бездумно и один математик вам подгонит так, что это будет работать, а другой, не-математик, подгонит так, что работать не будет. Для этого, в том числе, и разрабатываются унифицированные методы подгонки ансамблей.
В чем «качественность» вашего метода подгонки?
В классическом прогнозировании исследователем задаётся семейство функций описывающих поведение объекта, после чего производится «форвард» тестирование. Например, исследователь может применять к объекту семейство полиномиальных функций x+x^2+...x^n. Где n — ограничение степени полинома.
Вывод о том, соответствует ли динамика объекта выбранному классу функций или нет, осуществляется на основании «бэк/фовард» теста. Форвард теста в том смысле, что результаты тестирования каждого класса функций осуществляются форвард тестированием, а бэктеста в том смысле, что выбор лучшего класса функций и, соответственно, вывод о природе объекта, подбирается исходя из результатов форвард тестирования на всёх доступных данных (аналог бэктеста).
Аналогичным образом подбирается наилучшая архитектура нейронной сети или выбор метода машинного обучения — SVM/RVM/Boosting. Это, вероятно, совершенно не то, что вы имеете ввиду под бэктестом и поэтому такие «плохие» результаты для вас являются удивительными.
Это такой же самообман. Подгонка подгонки…
Прогнал 2012-2018 (те же 7 лет), CAGR = 60%
Эквити без костов (здесь %, поэтому 2500 соответствует 25 на вашей шкале):
Какие косты заложены на транзакции?
Сделайте walk-forward оптимизацию — т.е. составляете свой портфель на данных до 2008 — следующий год торгуете, и так далее каждый год. Эти результаты будут более реалистичные.
Получить робастную границу можно несколькими способами. В данном случае использовано пропускание исторической доходности через ковариационную матрицу. Условно считается, что доходность Лукойла, например, подтверждает доходность Роснефти, так как обе акции принадлежат нефтяному сектору.
Аналогичная процедура проводится при взвешивании экспертных оценок — если у вас есть прогноз по Лукойлу +100% за год, то, должно быть, у вас и прогноз по Роснефти около 70% годовых с учётом корреляции 0.7. Такая процедура позволяет учесть большое кол-во разнообразных прогнозов по разнообразным инструментам и в итоге получить некоторый взвешенный прогноз. Если мы правильно пониманием, та же процедура проводится при формировании портфеля Блэка-Либермана.
Соответственно, если Лукойл показывает некоторую неподтверждённую Роснефтью доходность, то эта неподтверждённая часть доходности признаётся случайным выбросом.