Блог им. AlexeyPetrushin

Модель должна давать 2 цифры для прогноза

Прогноз и Уверенность. Как распределение N(х, uncertainty) (распределение будет нормальным).

Это то что позволит модели пропускать события в которых она не уверена и делать ставки только если есть высокая уверенность в исходе. 

Например, при прогнозе волатильности, есть отличия в точности прогноза когда недавняя вол > исторической (предсказывает лучше) и историческая > недавней (предсказывает хуже).

И делать ставки (напр. продавать опционы) только в случаях когда уверенность высокая.

Собственно, это давно известно, в том числе как распределения для байесовских параметров. Но часто забываешь, и смотришь на «итоговый» скоринг предсказания, забывая посмотреть в деталях, возможно он предсказывает некие специфические случаи намного лучше и имеет смысл заняться ими подробней.
9 комментариев
при прогнозе волатильности, есть отличия в точности прогноза когда недавняя вол > исторической (предсказывает лучше) и историческая > недавней (предсказывает хуже)
Что вы называете «точность прогноза волатильности»? Допустим имеем ситуацию: недавняя вол > исторической. Означает ли это что на следующем шаге вероятность
|С — С(-1)| (по модулю) будет больше/меньше |С(-1) — С(-2)|
или  |С — С(-1)|><недавняя вол
или что?
avatar
Большой Брат, Например для прогноза цены на месяц:

«недавняя вол > исторической» уверенный прогноз:
  Vol[log return]=N(mu=0.15, sigma=0.1)

«недавняя вол < исторической» неуверенный прогноз:
  Vol[log return]=N(mu=0.15, sigma=0.2)

«Уверенность» это дисперсия для предсказываемого параметра (волатильности в нашем случае), когда уверены, сигма 0.1, когда не уверены она больше 0.2 (цифры условны). Сам прогноз 0.15 может одинаков в обоих случаях
avatar
Alex Craft, Не знаю что вы там насчитали, но это не согласуется с эмпирикой.
Когда «недавняя вол < исторической» цены во флете, приращения цены во флете сами по себе малы и дисперсия, которую вы называете уверенностью тоже априори должна быть меньше (прогноз точнее), чем при «недавняя вол > исторической»
avatar
Большой Брат, я отдельно сделал регрессию для 2х случаев — недавняя вол больше/меньше исторической. Ошибка посчитанная как likelihood в случае когда недавняя волатильность ниже исторической получилась выше.
avatar
Большой Брат, за тихим периодом, хотя большинство движений малы, может следовать резкий скачек, возможно поэтому ошибка больше. Likelihoid чувствителен к таким промахам и сильно за них наказывает.
avatar
Alex Craft, В локальный момент пробоя-скачка понятно будет ошибка возникать… Но на ваших массивах данных какое соотношение по времни состояния когда «недавняя вол < исторической» по сравнению с «недавняя вол > исторической»?
avatar

Большой Брат, не могу сказать точно, нужно смотреть. Скорей всего не много. Думаю ошибка большая в итоге получается потому что Likelihoid очень сильно наказывает такие ошибки — когда ожидал невысокую волатильность а оказалась высокая. И малое число таких ошибок могут перевесит большее число корректно угаданной низкой волатильности.

Если вы хотите посчитать я могу выложить (завтра) данные и питоновский код.

avatar
Большой Брат, посмотрел, вы правы, все наоборот, когда недавняя волатильность ниже исторической точность предсказания выше.

// Я разные индикаторы использовал, один лучше когда больше, другой наоборот, и ошибся между ними, посчитав наоборот.
avatar

теги блога Alex Craft

....все тэги



UPDONW
Новый дизайн