Блог им. cerenc

О прогнозировании временных рядов

    • 27 января 2016, 10:32
    • |
    • cerenc
  • Еще

Как учат классики, рациональной основой прогнозирования, является – априорная вероятность, например цены.

Стратегия « регрессия к среднему » в качестве такого априорного значения определяет среднее значение временного ряда, однако, его продолжительность не устанавливает.

 В одной из статей по этому вопросу Тайлер Чессман http://www.osp.ru/win2000/2013/10/13037710/ отмечает

 « Работая с временным рядом, история которого уходит далеко в прошлое, вы можете захотеть включить в модель все исторические данные. Однако подчас дополнительная история не повышает точность прогнозирования.  Давние данные могут даже исказить прогноз, если условия в прошлом существенно отличаются от условий в настоящем...

 Мне не попадалась какая-то особая формула или практический метод, которые подсказали бы, какое количество исторических данных необходимо включить...».

 Учитывая, что Чессман, не математик, какова практика решения этого вопроса более обоснованным образом...?!  

★7
42 комментария

Эконометрика Байеса, фильтры Калмана, Ходрика-Прескотта, cезонное сглаживание Tramo-seats вам в помощь. В общем, покопайтесь в EViews и MatLab

avatar
Сергей, если возможно, то Ваше мнение — на вскидку...?!
avatar
cerenc, естественно, чем длиннее ряд, тем, как праивло, лучше. Если подх-одить визуально, то необходимо, чтобы вряд попало как минимум два тренда и как минимум несоклько ярких выбросов сезонности (банальный анализ сезонности автокорреляцией или статистикой Дарбина-Уотсона можно провести). Отсюда для множества биржевых данных лучше ряд среднего технического цикла (период 100-105 точек). Для маркоэкономичесикх квартальных данных лучше взять не меньше 10 лет (не менее 40-50 точек), месячных данных — соответственно, 120-150 точек.

Биржевые графики отталкиваются от стандартных циклов. В одном цикле до 105-150 точек, вот в анализируемые ряды должно попасть желательно два цикла.
avatar
Сергей (serzinho), да спасибо…
avatar
Сергей (serzinho), а на 50 лет не берете ряды? :)
avatar
Артем Ковтун, я работаю с макроэкономической статистикой по России, поэтому 50-летние ряды здесь невозможны в принципе. Основные ряды около 20 лет, или от 1998 года (из-за пересчета цен вопследствии девальвации и деноминации). 
avatar
Сергей (serzinho), вы прям загрузили,
пусть сначала с arima и *arch моделей начнут;)
avatar
AlexeyT, и потратив кучу времени на это поймут, что практического применения в связи с точностью прогноза этими методами для трейдинга практически нет. Так, парочку статей написать. Как вспомню, сколько времени было убито на тот же Фильтр Калмана...
Прогноз временных рядов — это вещь в себе. 
avatar
Semen, я для этого и написал, и смайлик поставил,
через все надо пройти, развеять иллюзии так сказать
avatar
Semen, само собой Калман мало применим к биржевым графикам, вот макру с его помощью анализировать можно
avatar
AlexeyT, ну так это сезонное сглаживание и корректировка:) я думал, им прогнозирование тренда нужно:)
avatar
Однако подчас дополнительная история не повышает точность прогнозирования
и это ключевая мысль! самая большая проблема во всех математических методах-это где взять начало координат
avatar
Алексей, верно, но полагаю, как пишет Сергей выше, есть известные подходы…
avatar
cerenc, есть конечно!
avatar
Алексей, точно.
Дайте мне точку опоры входа — и я переверну Землю разверну тренд)))
avatar
Алексей, в начале функции. или в конце предыдущей функции.
avatar
Jkrsss, 

хорошо…
avatar
Jkrsss, функция может быть просто числом, откуда у него будет начало или конец? ;)
avatar
)()(, просто число это линия. (у=кx+b) все хорошо, главное чтобы не видно было.  А вот где начало и конец сами думайте, на то вам и думательный аппарат.
avatar
Алексей, «одна из», но не самая. И есть решения где начала координат не так важно… может быть «цикл», и если есть цикл начало не важно — пройдет «цикл» и потом будет такойже «цикл».
avatar
Vlаdimi®, да, как-то смотрел тексты этого человека, про варенье было интересно…
avatar
В таком  виде ряды — путь в тупик. Почитайте теорему Такенса.  Она подсказывает путь, но все равно необходимы  доп.  спецзнания  «о чем не говорят, чему не учат в школе»
avatar
Просмотрел статью. Там нет главного, проблема в нахождении правильной модели. Линейная модель будет адекватна только на растущем участке. На синусе модель покажет ноль. Всегда могу построить модель, которая полностью повторит любые данные на истории, вопрос будет только с ее адекватностью и способностью прогнозировать.
Дмитрий ЕрМак, 

вся фишка в том, что в условиях априорных вероятностей, адекватность самой модели, если не малозначима, то не так уж важна ( перекрывается " точностью " модели априорности, в этом её сила ...)     
avatar
Максимальные знания которые я знаю по этой теме — квантовомеханические методы. Там работают с координатами (координата там это самосопряженный оператор-матрица), вычисляют волновую функцию, вычисляют опретаор эволюции (который переводит систему из одного состояния в другое, — типа то что мы наблюдаем у таймсерии — с течение времени координата меняется) и т.д. и т.п. Есть книга Мерцбахера «Квантовая механика» на Английском там подробная информация. log-in.ru/books/kvantovaya-mekhanika-e-mercsbakher-eugene-merzbacher-nauka-i-obrazovanie/
avatar
прогнозирование цены- это прогнозирование спроса и предложения, которые изменяются в зависимости от того, хочу я продать вам и хотите ли купить вы. Если я знаю, что упадет, то я вам продам, а если вы знаете что вырастет, то купите. Но как так может быть, что два человека  видят рынок по разному?  Ответ очевиден, во первых  разный отрезок времени, а во вторых изменение цены происходит, когда не все участники меняют свой взгляд на изменение цены, а лишь та группа участников у которых денег больше. Так как вам цена, может подсказать, это изменение цены? только когда она изменится! А что может предсказать само изменение цены? только условия ее изменения!!! И вы по прежнему думаете, что временные ряды надо прогнозировать, только основываясь на истории изменения этого ряда?
avatar
SMA, в механике, например, не спрос и предложение, а кинетическая и потенциальная энергия, когда одно превышает другое происходит разворот… Без Матлаба начинать всем этим заниматся imho нереально.
avatar

)()(, мне кажется как то не совсем верно или полно, строить прогноз на основании следствия, а не причины. скажу проще.

Но поможет ли тут мат.лаб?  Возможно, если в нем анализировать причину. Но вот анализ следствия и на этом основании прогноз, мне кажется это не корректным, вот если это объединить, то да, тогда шансы есть.

avatar
SMA, птенциальная и кинетическая энергия являются причиной изменения цены, если использовать термины физики.

Поэтому не соглашусь с тем, что используются следствия а не причины.

???

Матлаб — матричная лаборатория, а один из самых старых методов в механике — матричный. Язык матриц, мне кажется, наиболее простым в математике, но он очень объемный в реализации (матрицы могут быть очень большими).
avatar
)()(, В механике в точке, где происходит разворот, скорость равна нулю. А значит, и кинетическая энергия равна нулю. А точек, где кинетическая превышает потенциальную или наоборот--таких точек основная часть, по сути, почти в любой точке это так. При помощи правильного выбора начала отсчета для потенциальной энергии можно сделать так, что вообще все точки будут такими. Но точек разворота среди таких точек очень мало.  


avatar
anatolyutkin, где кинетическая превышает потенциальную или наоборот--таких точек основная часть

— правильно — даун и аптренд соответсвенно. смена аптренда на даунтренд — это потенциальная больше кинетической, т.к. кинетическая идет в формуле с + а потенцияальная с -.
avatar
)()(, В механике в точке, где происходит разворот, скорость равна нулю. А значит, и кинетическая энергия равна нулю. Разворотная точка характеризуется равенством нулю кинетической энергии. А не равенством кинетической и потенциальной энергий. 
avatar
SMA, временные ряды надо прогнозировать, только основываясь на истории изменения этого ряда?

Раньше, разделял это мнение в полной мере, теперь же больше склоняюсь  к тому, что основополагающая теза тех. анализа — цена учитывает все, при " рациональной выборке " и умению задавать определяющие её ( цену ) факторы,  играют вполне надежно…
avatar
SMA, согласен с вами. Сам по себе временной ряд — просто набор цифр.
avatar
Писал про достоверность исторической информации http://artemkovtun.livejournal.com/8541.html что сравнивать между собой данные даже в периоде 5 лет не корректно, о чем прекрасно знают рядщики с понятием срок валидности модели. 

Ну и история всегда повторяется но повторяется всегда по новому. Математика в этом случае не должна ставить задачу — точного определения. Что давно все поняли и рисуют «пасти дракона» — диапазон значений. Вот этот диапазон можно ограничивать уровнями и векторами, и считать скажем его площадь что геометрически может отразить «величину риска», от этого можно посчитать и нормативно применять подушку риска и тп. 

Три: для хорошей системы, полной и точной, надо максимальная выборка результатов, максимальная выборка как перепись населения например. Такой выборки нет. Вот анализировал кто-то поведение индекса — а о какой-то информации и не знал, не было в выборке. Или наоборот что-то придумал и мнение исказилось. 

Забудьте о статистике-в-себе. Не сможет робот посчитать без валидации руками и образным мышлением правого полушария.
avatar
Артем Ковтун, согласен, глобально происходят системные изменения, которые могут существенно влиять на набор факторов или ошибки того или иного временного ряда, поэтому очень длинные ряды — такое же зло, как и короткие:)
avatar
Артем, любое прогнозирование именно «будущей» ситуации, а не вероятности повторения прошлой – возможно только с применением фундаментального анализа конъюнктуры любого явления.

Сейчас, я разделяю другое мнение: "… основополагающая теза тех. анализа — цена учитывает все, при " рациональной выборке " и умению задавать определяющие её ( цену ) факторы,  играют вполне надежно "

avatar
cerenc, будующее известно если известен оператор эволюции.
avatar
)()(, беседа выходит за рамки открытых обсуждений, могу лишь сказать, что применительно к «нашим баранам » найти такой таргет не только возможно, но и очевидно ( просто как все гениальное )…
avatar
Забудьте о статистике-в-себе.

Канеман утверждает, что способностей к ней исходно у человека и нет, потому и забывать как-бы и нечего?!

Тот же багаж знаний, который удалось приобрести, по его мнению. это то, чем следует дорожить ... 
avatar
Может для начала стоит посчитать автокорелляционную функцию того, что хотите прогнозировать? В первом приближении если коэффициенты АКФ равны нулю, то прогноз скорее всего невозможен, если хоть один отличен от нуля, то с рядом можно работать. Сезонность в этом случае вылезет на одном из старших лагов.
avatar

теги блога cerenc

....все тэги



UPDONW
Новый дизайн