Михаил, я думаю так нельзя делать. Насколько я знаю, статистику нельзя использовать для индукции или синтеза системы/структуры. Только для калибровки параметров в уже созданной структуре/системе, либо для отброса созданной системы как неверной. Особенно для такой плохо определенной и тяжелой для стат. анализа области как финансы. И, тест КолмогороваСмирнова в данном случае фундаментально ошибочен и неприменим, а Андерсона Дарлинга тяжело использовать из за недостатка данных в хвосте. Поэтому приходится надеятся что после долгих медитаций и рассматриваний графиков и цифр, посетит какая то яркая идея :). Точнее — я стандартные и известные вещи использую, но мне интересно увидеть вживую как именно они работают, а не просто прогнать некие вычисления вслепую. Тесты и стандартные подходы я конечно прогоню потом, но пока мне именно интересно попробовать увидеть структуру…
Михаил, спасибо за замечание, серия посчитана как diff[i] = log(p[i]/p[i-360]) (360 для года, 180 для полгода и т.п.) если цена не изменилась log(1/1 = 1) = 0
пробовал раздельные распределения для вверх и вниз (от нуля или средней), распределения не нормальные получаются, параметров в 2 раза больше, доверительные интервалы на порядок сложнее считать, а результата особо не улучшило
PS на картинках, лично мне, сходу всё непонятно, надо вникать
А почему у вас «логарифмов изменений цены» — что это такое? Когда цена не изменилась — логарифм не определен. Или это все-таки «изменений логарифмов цены»? Реально читать сложно, потому что не понятно о чем пишете, если читать буквально
wistopus, грубое предсказание цены, точность недостаточна дляполучения прибыли, но достаточная чтобы заметить явные ошибки и потери. И для симуляций различных сценариев, стресс теста и т.п. Это элемент этих расчетов.
Практическая ценност — это не позволит выиграть, но позволит свести игру в ноль.
Alex Craft, да с распределениями случайных величин r*X+(1-r)*У, где r случайная величина равная нулю или единице и р(r=1)~1, а Х и У — две разные случайные величины вообще лучше всего критерий Манна-Уитни для понимания, какое распределение Х и какое р(r=1). Ведь Парето на всем множестве приращений цен или логарифмов цен и быть не может. А Колмогоров-Смирнов — самый хороший критерий только для случая выборки из одного и того же непрерывного распределения с плотностью и любыми ее «хвостами». Если функция распределения со скачками, то да, критерий Колмогорова-Смирнова «не очень», но судя по тому, что и у Anderson–Darling интеграл от Fn, то тоже для скачкообразных распределений «не очень».
А. Г., я думаю что это парето, потому что из за ограниченности сэмпла мы видим лишь часть экстремальных событий, лишь часть хвоста. Если бы данные были за тысячу лет, то график бы выглядел (это моя догадка конечно, может ошибочная) как на рисунке ниже, где я продолжил линию искуственно (по аналогии с теорией предельных значений).
Но это догадка конечно, сказать наверняка нельзя :)