Блог им. Kot_Begemot

Портфельная оптимизация как бустинг на «слабых» моделях

Часть 2.

В прошлой части мы подбирали такую комбинацию статистических оценок динамики акций, которая давала нам возможность стабильно выбирать портфель акций лучше среднерыночного,  с показателем Шарпа на 26% выше индексного.

Мы также пробовали составлять портфель из портфелей и портфель на основе портфеля оценок, но в силу высокой линейной зависимости оценок и полученных на них портфелей друг от друга Bagging ожидаемо не дал никакого результата.

Тем не менее, этот важный этап подготовительных работ – построение портфеля (или композиции портфелей) на простых, статистических оценках дал нам некоторую отправную точку, относительно которой мы будем рассматривать эффективность всех наших последующих нововведений.

Портфельная оптимизация как бустинг на «слабых» моделях
Рис. 6. Иллюстрация динамики волатильности акций США, входящих в состав индекса S&P 500.

 

Основную проблему стандартных методов мы видим в том, что они разработаны для стационарных стохастических процессов, в то время как любые финансовые (а зачастую природные, биологические и др.), временные ряды имеют нестационарную природу. Так, например, широко известно, что логарифмическое изменение стоимости акций является нестационарным процессом со склонностью к консолидации (кластеризации) волатильности.

В финансовой математике для описания подобного рода явлений широко используются различные авторегрессионные модели – ARCH, GARCH и прочие. Что вполне естественно, так как любая AR модель, например, простая синусоида, будет обладать вышеупомянутым свойством кластеризации.

В этом смысле, вполне естественно, что статистические оценки для подобных нестационарных рядов, полученные средствами, заточенными под  ряды стационарные (с постоянной волатильностью), будут сильно искажены, а результаты их применения будут бесполезны. (Простейший портфель показал результаты на валидационном тесте даже хуже среднерыночных)

При этом одних только авторегрессионных моделей волатильности существует порядка сотни, а наряду с ними желаемые распределения с «тяжёлыми хвостами» можно получить с помощью моделей случайной волатильности, например, подбрасывая монетку со случайной ставкой и ещё целого ряда различных методов.

Таким образом, имея такой широкий спектр разнообразных моделей  (если они действительно достаточно разнообразны и, соответственно, линейно независимы) мы можем рассчитывать на то, что композиция (Bag/Boost) этих моделей будет обладать намного более высокой обобщающей способностью (прогностической силой), чем каждая из них в отдельности.

 

Следуя этим рассуждениям, мы подготовили базис из около 50 различных методов оценки риска, доходности и корреляции, учитывающих нестационарность финансовых временных рядов различными способами – от AR-процессов, до оценки рисков по Сортино, – на основе которых впоследствии был построен ряд наиболее устойчивых композиций.

Такой подход позволил нам добиться значительного улучшения показателя Шарпа на рынке NASDAQ по сравнению с портфелем, составленным из простой комбинации простых оценок, но, к сожалению, при линейном переносе полученной композиции на рынок акций ММВБ мы получили далеко не самые лучшие результаты. При этом, новая композиция, заточенная под рынок ММВБ, пересекалась с композицией, заточенной под рынок NASDAQ  всего на 30-40%. Что говорит о ещё недостигнутой универсальности методов.

 

Продемонстрируем полученные результаты на примере 24 голубых фишек, входящих в индекс ММВБ:

   Портфельная оптимизация как бустинг на «слабых» моделях

 Рис.7. Точечная диаграмма голубых фишек ММВБ в плоскости доход/риск за последние 7 лет (24 фишки).

На графике дополнительно изображена апостериорная эффективная граница портфелей Марковица (синяя кривая), «робастная»  апостериорная граница с фильтрацией случайных колебаний доходности (пунктирная) и Security Market Line (красная) в виде линейной регрессии по собственному риску. 

 

На этих данных мы построили ряд портфелей, каждый из которых имеет только три экзогенных переменных (входные параметры) – длинна обучающей выборки, уровень сглаживания (если оно применяется) и оптимальный инвестиционный срок (частота пересмотра портфеля):

 

 Портфельная оптимизация как бустинг на «слабых» моделях
Рис. 8. Демонстрация динамики ликвидационной стоимости портфелей.

  1. Красная – Boost Portfolio – портфель, полученный на сложной композиции нестационарных и стационарных оценок.
  2. Фиолетовая – Simple Non-Stationary Portfolio – портфель, полученный на лучшей комбинации нестационарных оценок, с поправкой на кластеризацию волатильности.
  3. Синяя – Simple Stationary Portfolio – портфель, полученный на лучшей комбинации стандартных оценок.
  4. Зеленая – Equal Part Portfolio – пассивная равновесная стратегия, соответствующая индексу ММВБ (средняя по данным)

 

 Портфельная оптимизация как бустинг на «слабых» моделях
Рис. 9. Демонстрация динамики ликвидационной стоимости портфелей в логарифмическом масштабе. В качестве особых точек выделены точки, соответствующие максимальной просадке индекса и Boost портфеля.

 Портфельная оптимизация как бустинг на «слабых» моделях
Табл. 2. Статистические характеристики полученных портфелей и предполагаемая максимальная просадка на уровне трёх сигм.

 

В качестве текущих проблем мы видим:

  1. Низкую универсальность оценочных методик, требующую значительной корректировки при применении к различным рынкам (ММВБ, NASDAQ).
  2. Высокую степень зависимости полученного портфеля от индекса, повторяющую все его убытки.
  3. Отсутствие адекватных методик,  не требующих применения подхода Bag/Boost.

 Портфельная оптимизация как бустинг на «слабых» моделях
Рис. 10. Корреляция доходности Boost портфеля и индекса iMOEX.

Обычно корреляция снижается путём покупки 20-40% облигаций, но это говорит не о качественном решении задачи управления портфелем ценных бумаг, а об отсутствии такового.

 

 Портфельная оптимизация как бустинг на «слабых» моделях
Рис 11. Демонстрация динамики относительных весов активов в Boost портфеле. Время отложено по оси ординат (сверху-вниз), активы – по оси абсцисс.

Видно, что Boost портфель на 80% своего состава преимущественно выбирает две-три, наиболее доходных, некоррелированных акции (из 24), лишь изредка прибегая к концентрированным вложениям в один актив.

★22
32 комментария
 Качественное исследование, спасибо. 
avatar
А. Г., и даже на главную не вышло!
ужас
Тимофей Мартынов, очень много политично-замороченых людей стало на Смартлабе. Я что сделал: сначала прикинулся про-одним, меня забанили в ЧС про-вторые. Так ходил год. Затем пререкинулся к про-вторым. Меня забанили про-первые. Теперь политосы меня вроде почти все забанили (и я их взаимно). Вроде легче жить стало. Но плюсиков к топикам будет очень мало!
Fry (Антон), )))
avatar
 поднял пост на главную!
эх молодость!
портфелем туда, портфелем сюда...
а потом рынок тебе впендюрит.

мужики, которым дали нобелевку по экономике, тоже думали,  шо они круто портфэли составляют. пока не пришёл 2008 год. там они свой фонд с портфэлями и просрали.
avatar
Kapeks, это был 1998-й, если вы про лтсм. Хотя в 2008-м меривайзер ещё один фонд просрал. А до этого не помню в 87-м или начале 90-х — ещё один в Соломоне.
avatar
MadQuant, да я уже забыл как там их звали. суть одна: будь ты хоть трижды гений математики — рынку похер на твои модельные портфэли.
avatar
Kapeks, да, это правда. Хотя одно исключение есть — renaissance technologies. Подтверждение, что много гениев физики и математики способны показывать чудеса.
avatar
MadQuant, спасибо, почитаю на досуге.
avatar
Kapeks, Если Вы о LTCM-98, то причем здесь портфель, если там был банальный статарбитраж (де-факто контртренд на спреде) с плечом между ставками облиг развитых и развивающихся стран? В этом спреде случился тренд, который и «похоронил» арбитражеров-плечевиков. Никакой «глубокой» математики тут нет, а есть банальная недооценка вероятности возникновения тренда в спреде коррелированных активов.
avatar
А. Г., это детали.
Лауреат Марковиц управлял инвестициями в Фэнни Мэй и там тоже всё навернулось. Вопрос, почему великие гении экономики не могут успешно применить свои теории на практике? Ответ, потому что рынку похер на модели этих «гениев».
avatar
Kapeks, дайте ссылочку на слив Марковицем в Фанни Мэй. Интересно почитать подробности. Если это 2008-й, то неудивительно: в тот год любой b&h сливал, хоть с портфелем, хоть без, хоть с математикой, хоть без нее. Это риски b&h, а не теорий. 

А вот LTCM, это более поучительная история для статарбитража вообще, но никак не для портфеля.
avatar
А. Г., ссылки нет. по памяти писал. гуглить надо.
avatar
А. Г., 
Это риски b&h, а не теорий

прекрасная логика!
avatar
Kapeks, это факт.
avatar
Спасибо за статью. Сяду в выходные и вдумчиво разберу.
Нам, трейдунам, которые сравнивают свои доходности с инвест.портфелями, очень полезно всякое такое для личностного роста. Всё время собираюсь начать накапливать акции. Вот уже скоро!
Супер!
avatar
Из кучи моделей выбрали их взвешенную комбинацию по всей доступной истории? Или как?
avatar
wrmngr, можно сказать и так, хотя там всё несколько сложнее. Взвесь, естественно самая простая, полученная простым голосованием. Для сложных взвесей боюсь оверфитинга, так как полезут дополнительные «глобальные» параметры.
avatar
Kot_Begemot, а причем здесь прогностическая сила? это получается подгонка под данные. Как проверялась устойчивость метамодели?
avatar
wrmngr, любая модель это подгонка под данные. В этом смысле не должно быть иллюзий. Даже простое матожидание, как ни странно — подгонка. Подгонка под стационарный винеровский процесс или коричневый шум (если применительно к стоимости актива). И соответствует такая подгонка минимуму SSE, то есть минимуму ошибок подгонки. То же самое с корреляцией — она высчитывается как линейная регрессия одной переменной по другой, доставляющей минимум SSE.

Не пытайтесь заниматься самообманом и делать вид, буд-то какая-то математика или какая-то логика (а следовательно какой-то метод, какая-то ТС) не являются подгонкой. Все это выдуманные, нереальные объекты подогнанные под действительность. Разница лишь в том, что подгонять можно качественно, а можно бездумно и один математик вам подгонит так, что это будет работать, а другой, не-математик, подгонит так, что работать не будет.  Для этого, в том числе, и разрабатываются унифицированные методы подгонки ансамблей. 
avatar
Kot_Begemot, это все понятно. Но вот у вас там десятки моделей, у каждой модели  2-3 параметра. Потом еще голосование. Я просто удивлен что на бектесте  получилось так плохо. Должен быть космос.
В чем «качественность» вашего метода подгонки?


avatar
wrmngr, дело в том, что мы с вами используем абсолютно разные методы и поэтому наше понимание бэктест/форвардтест абсолютно различно. Разнообразие опыта не позволяет нам с вами легко понимать друг друга.

В классическом прогнозировании исследователем задаётся семейство функций описывающих поведение объекта, после чего производится «форвард» тестирование. Например, исследователь может применять к объекту семейство полиномиальных функций x+x^2+...x^n.  Где n — ограничение степени полинома.

Вывод о том, соответствует ли динамика объекта выбранному классу функций или нет, осуществляется на основании «бэк/фовард» теста. Форвард теста в том смысле, что результаты тестирования каждого класса функций осуществляются форвард тестированием, а бэктеста в том смысле, что выбор лучшего класса функций и, соответственно, вывод о природе объекта, подбирается исходя из результатов форвард тестирования на всёх доступных данных (аналог бэктеста).

Аналогичным образом подбирается наилучшая архитектура нейронной сети или выбор метода машинного обучения — SVM/RVM/Boosting. Это, вероятно, совершенно не то, что вы имеете ввиду под бэктестом и поэтому такие «плохие» результаты для вас являются удивительными.
avatar
Kot_Begemot, 
Для этого, в том числе, и разрабатываются унифицированные методы подгонки ансамблей.

Это такой же самообман. Подгонка подгонки…
avatar
Kot_Begemot, специально поднял архив, нашел концептуально похожий ротационный алгоритм на акциях MOEX (на списке TOP15 ликвидов), где ежедневно рейтингуются акции по простейшему критерию в одно арифметическое действие. Никаких намеков на продвинутые модели. Никакой оптимизации, никаких голосований. Тупая сортировка по одному критерию.
Прогнал 2012-2018 (те же 7 лет), CAGR = 60%

Эквити без костов (здесь %, поэтому 2500 соответствует 25 на вашей шкале):





avatar
wrmngr, существует простое правило бритвы Оккама — из двух сложных решений, дающих одинаковый результат, всегда лучше то, которое проще.
avatar
Kot_Begemot, а кто с этим спорит? Мое решение на схожей задаче очевидно проще
avatar
Kot_Begemot, графики относятся к бектесту на голубых фишках MOEX?
Какие косты заложены на транзакции?
avatar
Согласен с коллегами, если оптимизация велась на всей истории — это просто подгонка под историю, и нереалистичные результаты сильно больше 30 годовых это подтверждают.
Сделайте walk-forward оптимизацию — т.е. составляете свой портфель на данных до 2008 — следующий год торгуете, и так далее каждый год. Эти результаты будут более реалистичные.
avatar
У вас в тексте говорится про робастную эффективную границу — можно пояснить, что это такое?
avatar
Михаил, мы уже отказались от этой идеи. Первоначально робастная граница использовалась как ориентир, некоторая целевая доходность и некоторый целевой риск. Однако, на практике, оказалось, что портфель пересобираемый непрерывно намного превосходит все стационарные портфели, неизменные на протяжении всей истории.

Получить робастную границу можно несколькими способами. В данном случае использовано пропускание исторической доходности через ковариационную матрицу. Условно считается, что доходность Лукойла, например, подтверждает доходность Роснефти, так как обе акции принадлежат нефтяному сектору. 

Аналогичная процедура проводится при взвешивании экспертных оценок — если у вас есть прогноз по Лукойлу +100%  за год, то, должно быть, у вас и прогноз по Роснефти около 70% годовых с учётом корреляции 0.7. Такая процедура позволяет учесть большое кол-во разнообразных прогнозов по разнообразным инструментам и в итоге получить некоторый взвешенный прогноз. Если мы правильно пониманием, та же процедура проводится при формировании портфеля Блэка-Либермана.

Соответственно, если Лукойл показывает некоторую неподтверждённую Роснефтью доходность, то эта неподтверждённая часть доходности признаётся случайным выбросом. 
avatar

теги блога Kot_Begemot

....все тэги



UPDONW
Новый дизайн