Smart-Lab 16.03.13: Адреналин от выступления, новая информация, знакомство с интересными людьми – получены!..=) Печаль, что была необходимость уехать раньше.
Хочется сказать спасибо Тимофею за поддержку и организацию, выступающим за доклады, аудитории за вопросы!..
Тяжело было осветить за полчаса поднятую мной тему. Для тех, кому интересно, периодически буду выкладывать информацию, относящуюся к эконометрическому моделированию.
…начну с простого:
В самом общем смысле
временной ряд – это последовательность количественных характеристик какого-либо процесса, измеренных через одинаковые промежутки времени. Временными рядами в трейдинге являются, к примеру, цены закрытия часа либо дня, годовые доходности актива (тиковые данные не являются временным рядом). Принципиально важными свойствами временных рядов является строгая упорядоченность и стационарность.
- Упорядоченность – информацию несут не только сами значения количественного показателя, но и их расположение относительно друг друга.
- Стационарность – среднее значение и стандартное отклонения количественного показателя постоянны во времени. Если ряд нестационарен, большинство эконометрических моделей к нему не применимы. Цена практически любого актива нестационарна, прирост цены и доходность – стационарные ряды.
Существуют 5 основных классов моделей временных рядов, разделяемых в зависимости от факторов, влияющих на цену (доходность), а также от размерности. ARIMA, ~ARCH, ARFIMA и трендовые модели – примеры одномерных моделей, они подразумеваю использование только одного показателя. VAR, SVAR и VEC-модели, это модели, использующие несколько коррелированных временных рядов.
Простейшей моделью временных рядов является модель класса
ARIMA. Данный класс моделей анализирует зависимость показателя от своих предыдущих значений и предыдущих ошибок прогнозирования. Для биржевых данных это означает, что текущая цена зависит от предыдущих цен и от того, насколько предыдущие цены были недооценены либо переоценены. Модель строится только для стационарных рядов, что позволяет на ее основе построить прогноз прироста цены. К преимуществам данной модели относится простая процедура оценки.
Модели класса
GARCH – это объединение двух уравнений: доходности или цены, зависящей от своих предыдущих значений и предыдущих ошибок, и стандартного отклонения цены, которое тоже зависит от своих предыдущих значений и своих предыдущих ошибок. Переменное стандартное отклонения позволяет, во-первых, применять данную модель к нестационарным временным рядам, во-вторых, учитывает так называемые «кластеры волатильности». Если рассмотреть график доходности или прироста цены, можно заметить периоды колебаний малой амплитуды и периоды резких колебаний – GARCH модели позволяют учесть эту особенность.
ARFIMA модели являются расширением ARIMA моделей, в них количество периодов времени в прошлом, влияющих на цену в настоящем, может быть не постоянным, как в ARIMA –моделях, а переменным.
Трендовые модели являются самыми простыми с точки зрения предпосылок о структуре ряда, однако самыми сложными с точки зрения процедуры оценивания. В трендовых моделях предполагается, что вся информация о цене содержится в самой цене, и задача заключается в том, чтобы выяснить, какая функция описывает зависимость цены от времени. Время в данном случае является единственным явным показателем в модели. При достаточно высокой точности полученных прогнозов успешность применения данного метода сильно зависит от того, насколько точно выбран класс функция для анализа. Точность существенно возрастает, если процедуру выбора функции поручить программе-роботу.
В многомерных моделях временных рядов кроме непосредственно ряда, для которого строится прогноз, используются также ряды, оказывающие влияние на основной ряд. К примеру, в случае с ценой финансового актива это могут быть цены других активов и макроэкономические показатели. В
VAR-модели рассматривается влияние только прошлых значений различных показателей на цену, в
SVAR – модели возможен учет одновременной реакции нескольких показателей на сторонний шок (а также влияние предыдущих значений). Обе модели не применимы к нестационарным рядам.
VEC модель разработана специально для анализа нестационарных временных рядов.
P.S.: уже выкладывала
пример работы с VaR .
По поводу софта: я пользуюсь несколькими -> Gretl, EViews, R и Stata (начиная с 8 версии).
С R у меня особые отношения, потому что там свой язык программирования, но посредством этого больше возможностей. =) Если что, могу поскидывать материалы.
Да поскидывай плизззззззз!) А лучше напиши отдельный топик про эконометрический анализ!) Я тебя защищу от критикунов всяких!))))
И подскажи просто книжки по статистике и эконометрическому моделированию, только такие чтоб с нуля было понятно, а то я так давно это все в институте изучал, некоторые базовые вещи совсем не помню!
Спасибочкиииии!
Топик обязательно напишу :) А про защиту ловлю на слове! :))
Куда лучше материал тебе отправить?
Если начинать с нуля, то так:
1) «Теория статистики», Громыко Г. — статистическая база;
2) «Теория вероятностей и математическая статистика» (блок математическая статистика), Л.Н.Фадеева, А.В.Лебедев — статистическая база;
3) «Введение в эконометрику», К. Доугерти;
4) «Эконометрика», Я.Р.Магнус, П.К.Катышев, А.А.Пересецкий;
5) Исследовательские статьи (как правило, на английском языке, если что, могу отправить).
Стать пока не надо, у меня там и так уже куча всего неразобранного!)
А еще нет ссылочки на EViews? А то нашел одну, а там стока манипуляций надо делать с программой, что у меня не фига не получилось, отказалась запускаться!
Спасибо!)
1) торгуете ли Вы опционы?
2) почему Var неприменим к нестационарным рядам?
удачи.
Ваше выступление было одним из лучших (можно даже сказать лучшим), хотя последние 3 я не видел пока, тоже пришлось уехать раньше. Весьма содержательно.
Огромное спасибо за них, они буквально дают кислород =)
Мне, в свою очередь, хочется поддержать Вас хотя бы тем, что многим обычно кажется после своего выступления, что оно прошло отвратительно. Но на самом деле редко, когда это совпадает с действительностью.
К сожалению, я ушла раньше Вашего выхода, пока не могу прокомментировать :)
Правда, самокритичность дает стимулы идти вперед, главное — не переборщить! =)
— отличное выступление!
— попробуйте в следующий раз своими вычислениями всех нагрузить. У меня большие сомнения, что хоть кто-то что-то смог бы возразить!
В следующий раз будут уже результаты!.. Надеюсь))
Но у меня к Вам несколько вопросов, которые я не понял из видео.
1. Какой исходный ряд для модели — сами цены, приращения цен или приращения логарифмов цен?
2. Сколько степеней свободы у подбираемых функций (трендов) и какой размер обучающей выборки?
3. Проверялась стационарность ошибки прогноза на обучающей выборке и out of sample?
4. Если в модели присутствует «Шок», то почему используется метод наименьших квадратов, а не робастыные ранговые или знаковые оценки?
Благодарю Вас за поддержку!.. С интересом смотрю и слушаю Ваши доклады и выступления =)
Ответы на вопросы получились следующие:
1. Исходный ряд — цены закрытия, но модель можно использовать для прогноза изменений любого показателя, который демонстрирует какие-то закономерности, например, были пробы использовать: (O+H+C+L)/4 и MA(3);
2. У подбираемых функций 151 степень свободы (тренд описывался экспоненциальной функцией, колебания рядами Фурье), число наблюдений, было равно 197;
3. Да, проверялась: было показано, что ошибка представляет собой «белый шум»;
4. Спасибо за подсказку с робастостью, надо будет разобраться =) На сколько я знаю, знаковые оценки не приспособлены для решения нелинейных задач.
Уточните про п. 3. Я имел ввиду, что выборка делится на две части. На одной подбирается функция, на другой просто прогоняется и сравниваются распределения остатков модели на равенство распределений. Это исследование проводилось?
Вот это желательно делать, чтобы избежать подгонки.
Ну я это имел ввиду, что без теста на другой выборке мы можем случайно подогнать параметры под результат. И в будущем наша модель работать не будет.
Но ведь тогда непонятно, как применять метод в неизвестном будущем. Если у нас в будущем будет работать другая функция, а та, которую мы подобрали на прошлом, работать не будет, то это же неприменимо для реальной торговли.
Сам недавно увлекся это интересно!)
спорное утверждение :)
А по сему вопрос, если эти модели делают прогноз на основе временных рядов на некое кол-во периодов в будущее, то по идее, анализируя «сдельные ряды», прогноз должен идти на некое кол-во сделок. Однако у сделки гораздо больше показателей которые надо прогнозировать.
1) Возможно ли вообще приложение эконометрики к тиковым рядам? На ваш взгляд.
2) Если да, то как осуществлять это прогнозирование в связи с большой зависимостью от стакана и большой волатильностью в размерах заявок? Фильтры или другие способы?
3) Может быть стоит использовать агрегированные по объёмам тики? Т.е. 1 свечка — это все тики, набравшие кумулятивно определённый объём.
Надеюсь понятно выразил свои мысли))
А чтобы тики моделировать, да и еще в реальном времени, нужен мощный компьютер!)
Эконометрический анализ к тиковым данным не применим.
Практический вывод: если удается предсказать временной ряд, из этого следует, что присутствует некая закономерность, которую можно понятно объяснить не прибегая, так сказать.
Вообще, у меня от них такое ощущение, что это банальные вещи, давно известные из других областей, но изложенные каким-то дико извращенным методом ))))
В ответ могу тоже объяснить что-нибудь из анализа временных рядов, ЦОС, и т.п., вдруг и у вас есть заковыристые вопросы )))
спасибо, прочитал. Правда, ясности это не добавило :)
Вот простой пример: я могу сделать линейную аппроксимацию и экстраполировать ее вперед, это будет линейная модель тренда (не котировок!). И она даже будет хорошо работать, пока тренд не начнет разворачиваться. Могу сделать параболическую, и даже аппроксимацию синусом, во всех случаях понятно, что является моделью и каким образом строится прогноз.
А вот какая сущность является моделью в ARx, совершенно непонятно.
В статье есть одна фраза, которая вроде бы отвечает на этот вопрос: «цены в ней образуются регрессией на себя». Но это только вызывает еще больше вопросов — из формул регрессия в явном виде не прослеживается, и вообще непонятно, что является парами значений.
вот для авторегрессии более-менее доходчиво изложено:
fnow.ru/ru/stati/obzor-algoritmov/avtoregressija
но тогда получается, модель АР — это обычный цифровой фильтр, да еще и с постоянными параметрами (упрощенно говоря, экспоненциальное сглаживание).
Непонятно, какая может быть польза от такой «модели» и как по ней можно что-то прогнозировать.
Отдельный вопрос, это пример данных, на которых они там строят прогноз. Это же практически шумовой сигнал, и надеяться, что очередной отсчет будет линейной комбинацией предыдущих, по-моему, наивно. Та точность прогнозирования, которую они там пытаются получить, на мой взгляд принципиально невозможна.