По мотивам… ну, вы сами поняли:)
Вместо пролога. Зачем нам волатильность? Зачем нам её приводить одну к другой и сравнивать? Её физический смысл — как далеко может убежать траектория случайного процесса. Надеюсь, на СЛ стало меньше людей, сомневающихся в том, что изменение цены и сама цена — процесс случайный? Итак, что нам говорит некая сигма? Что наш процесс в среднем убежит на столько-то и столько-то, если мы будем генерировать много траекторий или делать эксперимент много раз и тд и тп. Ну и классика для чистого СБ это квадратный корень. Ну и мы знаем, что если за 1 час в среднем пьяный матрос отклоняется по сторонам на 5 метров, то за 4 часа он в среднем отблуждает от некого центра на 10 метров.
Теперь цена. И в БШ и везде у нас для масштабирования волатильности используется квадратный корень.
А давайте посчитаем? Пойдем от обратного. Волатильности тут уже считали. И доказывали, что вся отлично выводится одно из другого путем взятия квадратного корня (хоть сперва на минутках посчитай минутную, хоть на дневках дневную). И это хорошо, посколько процесс один и хочется, чтобы волатильностей у него много не было — как ни считай. Правда нам уже и доказали, что не совсем это так и могут быть нюансы.
А мы давайте посчитаем вот что. Возьмем фРТС с 2005 года и будем его нарезать — сэмплировать на минутках. От часовых отрезков до нескольких дней. Каждый такой отрезок будем сдвигать вправо. И для каждого отрезка будем запоминать две величины: DP и DT. DP это насколько изменилась цена за данный отрезок, DT — сколько это заняло времени. Полный перебор сделать у меня, конечно, не получилось. Поэтому сэмплы я двигал по 20 минутных отсчетов и чем выше масштаб, тем меньше там получалось сэмплов. Итого:
DT в днях. Сделаем абсциссу логарифмической:
Ну вот мы и видим что-то такое нелинейное и вроде квадратичное. Оно и логично. Чем больше DT, тем больше будет DP, но вроде кажется, что как раз пропорционально квадратному корню. А давайте в малых окрестностях DT посчитаем сигмочки:
sdp это те самые волатильности, mdt это среднее значение DT для своей окрестности. После 30 дней совсем маленькие выборки, поэтому их отбросим и посчитаем желаемое:
Лучшая аппроксимация из элементарных — степенная, но не квадратный корень…
временами не случайны ;)
То, что какой-то процесс развивается во времени, не значит, что он от времени зависит. Например, размножение зеленых водорослей в пруду — процесс, явно зависимый от времени. А изменение вашей высоты над уровнем моря при гулянии по лесу — нет. Вы можете сопоставить каждое время t каждой высоте h, но функцию h(t) задать невозможно
Разве это не очевидно?
(теперь вижу, что сам себе противоречу, возможно пример с одноруким бандидом был не удачным)
P.S. я понял, в чем запутался — подумал, что R^2 тоже находится в показателе степени икса, все дело в скобках
R^2 (вообще нигде не находится). Это ESS
А я уж подумал, что это было просто такая форма записи единой формулы
0.0223 * x ^ (0.426*R^2) = 0.988
А это, оказывается, просто степенная функция и через пробел оценка отклонения…
Боюсь спугнуть, но выглядит всё так, как будто бы тут стали публиковать интересные топики по теме трейдинга.
Хм…
а вообще Афтару, конечно есть смысл дополнить последний скрин кривулькой N^0.5 ))
и несколько тезисов, вместо обоснования, если принимать Вашу гипотезу
* скейлинг на 'не корректное(переразмер-е) время' должен сказываться не на показателе, а на сдвиге всего временного ряда (это особенно д.б. очевидно при переходе N>5)
* в интервале N (0;1) aka при 'интрадее', отклонения были б прям существенные (тут бы для наглядности нам и пригодилась s(N)= N^0.5)
* такие штуки не дали б коэфф. корреляции порядка .993
Поэтому строго, имхо, но я больше склонен списывать это (mismatch .5/.426) все на интрадей/гепы и соответственно на «условную» нормальность (ну или возникающую периодич. не идентичность/деформацию) распределения, при которой естественно скейлинг sqrt(N) работать не будет
Получили степень 0.4476 вместо 0.5. Выходит, что влияние есть и оно существенно.
сорри я не оч. понял. а не д.б.
?
Попутно, как производилась склейка фьючей и зачем взяты неторговые дни в расчет.
Склейка никак не производилась. Я считал только по раздельным контрактам, файл за файлом, следил лишь за тем, чтобы каждый новый файл начинался после последней даты предыдущего. Поэтому так мало выборок с десятками дней — в одном контракте таких с гулькин нос можно нарезать. Я к торговым/неторговым никак в этом расчете не относился. Смотрел на это с точки зрения календарного времени и всё. Пока так. Т.е. неторговые дни попадают только при измерении времени dt.
dp=C(t)/C(t-k)-1
dt=difftime(datetime(t),datetime(t-k)), т.е. точная разница во времени, приведенная к календарным дням.
k — плавающая величина от 100 до десятков тысяч.
За 15 лет у Вас взято 59 фьючей. Для 1 месячных данных это более 200 независимых точек, даже для 90 дней — 59. Не так уж мало, но сыпь на третьем графике справа слишком уж размашистая, полумесяц — это странно.
(а) календарные дни вместо торговых
(б) смешивание внутридневного формата и овернайта
(в) отказ от логарифма в ретурнах
(г) смешение дней с вечеркой и без вечерки.
При этом не думаю, что эти замечания носят существенный характер. Лучше скажите, это можно как-то использовать?
Да, всё, о чем вы пишите, хорошо бы вычистить, но это — допработа, которой пока не охота заниматься, а результат хочется увидеть скорее. В данном случае это удовлетворение любопытства. Вот такой получился факт.
Если бы это в лоб как-то монетизировалось вот так сходу, я бы уже…
А что хотели увидеть, какой эффект?
S = S*(1+r)^dt
На рынках же учтываются внешние события (новости) и они действительно не зависят от времени, они просто случаются. Это импульс. А вот развите реакции на импульс очень даже зависит от времени и имеет вполне детерминированные паттерны. В журнале ФО была про это статья, и там в пределах нескольких минут была выявлена вполне ощутимая взаимная корреляция котировок во времени.
1- если ему расказывают о деньгах, то там уже нет денег.
2- когда ему трут за формулы, то разводят на комиссию.
3- если ему воще чето трут, то речь идет именно о его деньгах.))