Блог им. FZF

Биржевое распределение вероятностей

    • 13 февраля 2023, 18:28
    • |
    • FZF
  • Еще

Кто не первый день торгует на бирже, тот знает, что для описания вероятностных процессов происходящих на биржевых торгах не подходит формула нормального распределения вероятностей (распределение Гаусса). Рассмотрим нормальное распределение вероятностей (НР) и биржевое распределение вероятностей (БР). 

Нормальное биржевое распределение

Первое отличие БР от НР заключается в том, что БР имеет более «толстые хвосты». То есть, немного большая часть вероятностных событий находится дальше от точки математического ожидания. Этот факт можно объяснить тем, что в НР  {\displaystyle \sigma }  бсреднеквадратическое отклонение (волатильность) является константой, а в БР волатильность величина переменная и тоже случайная. Наличие своей дисперсии у волатильности дает нам дополнительное «размазывание» плотности вероятностей.

Возьмем формулу нормального распределения:
Биржевое распределение вероятностей


Поскольку б (среднеквадратическое отклонение) для БР переменная, то логично было бы представить ее в виде функции, либо добавить к текущему значению б «функцию размытия» r(x, б). Тогда для биржевого распределения будем иметь формулу следующего вида:


Биржевое распределение вероятностей

Функция размытия r(x, б) должна быть такой, чтобы итоговая функция:

 

— была близка по форме к нормальному распределению

 

— имела более толстые хвосты

 

— площадь ограниченная графиком должна быть равна 1 ( сумма всех вероятностей равна 1)

 

Существует такая функция удовлетворяющая вышеперечисленным условиям:
Биржевое распределение вероятностей

Подставляя (3) в (2) получим функцию распределения вероятностей на основе нормального распределения, но с более толстыми хвостами. Назовем ее «биржевое нормальное распределение» (БНР)
Биржевое распределение вероятностей

Полученное распределение показывает, что вероятность распределена в виде узкого канала, либо идет смещение в сторону начавшегося тренда. То есть возможность получения прибыли лежит в работе внутри канала, либо в следовании тренду.

«Логнормальное» Биржевое распределение

В реальной торговле (например, акциями) у нас не бывает отрицательных цен.  Изменение цены актива в меньшую сторону (приближение к нулю) приводит к уменьшению дисперсии, выраженной в абсолютных величинах. Изменение цены с 1 рубля до 2 рублей в относительных величинах будет равно 100%, но в абсолютных изменение будет всего на 1 рубль. В вышеприведенных формулах используются абсолютные значения дисперсии. Поэтому нам необходимо учесть уменьшение дисперсии в зависимости от уменьшения цены. Обычно для таких целей используют логарифмическую зависимость. Но такая задача гораздо легче решается с помощью квадратного корня.
Биржевое распределение вероятностей

Для этой цели б (среднеквадратическое отклонение)  умножается на функцию сжатия дисперсии L(x,a)=(х/a)^0.5

Полностью формула биржевого распределения вероятностей выглядит следующим образом:
Биржевое распределение вероятностей

В сравнении с логнормальной функцией распределения она выглядит следующим образом:
Биржевое распределение вероятностей

LN – логнормальное распределение; БР – распределение по формуле (4)

В данном случае, мы так же видим более толстые хвосты, чем у обычного логнормального распределения. Полученная формула является более подходящей для описания распределения вероятностей при торговле на бирже. Но в дальнейшем, данная формула требует обкатки в реальных условиях.

★15
65 комментариев
Но в дальнейшем, данная формула требует обкатки в реальных условиях.
и как же ее обкатывать?...
avatar
wistopus, Можно на опционах, можно просто на статистике (смотреть на сколько тория совпадает с реальностью)
avatar
wistopus, После этих картинок все очень просто.Если волатильность падает, то играть против движения цены, а если растет, то по движению.Правда есть маааленькая проблемка… волатильность антиперсистентна.)))
avatar
Если мы занимаемся биржевыми инвестициями, распределение не имеет значения. Имеет значение только тренд экономики/компании (даже не тренд акций компании).
Если мы спекулянты, то мы работаем с конкретной реализацией процесса на коротком интервале времени, где вид распределения тоже ни о чем и не дает нам никакой информации для сделки (сделок).
avatar
3Qu, Если… А если спекуляциями?
avatar
А чем докажешь???
Александр Сережкин, К чему именно вы хотите иметь доказательства?
avatar
FZF, общаемся на ты и без обид. Потому, что ты не знаешь, что практика основной критерий истины. Здесь тебе не детский сад, в котором все дети смотрят на твои формулы с открытыми ртами.
Александр Сережкин, Выкладывая гипотезу, требующую проверки, я рассчитываю, что особо любопытные займутся ее проверкой или найдут ошибки, и я сэкономлю много времени.
Вещи, которые реально работают, я не выкладываю в общий доступ. Либо выкладываю в сжатом виде, требующем большого приложения мозгов для использования.
Никого не обучаю и сигналы не продаю. 
avatar
FZF, выкладывая СВОЮ гипотезу без ты должен основываться на том, что нормальное распределение работает на бирже. Если ты здесь признаешь, что нормальное распределение не работает (но выдвигаешь СВОЮ гипотезу), то садись это 2!
FZF,
я рассчитываю, что особо любопытные займутся ее проверкой или найдут ошибки, и я сэкономлю много времени.
.
Вещи, которые реально работают, я не выкладываю в общий доступ.

Экономить он хочет, а делиться — нет. 
Уважаемый, а много ли у вас в роду евреев?
avatar
variantolog, Биржа, это место, где одни люди отнимают деньги у других. Отдавать свое преимущество в такой ситуации это глупость.
Так что, ничего личного, просто бизнес. Умные люди разберутся в той идее, которую я описал, и смогут применить. Остальные будут оплачивать их прибыль.
avatar
FZF, если я найду ошибки, то какой резон мне с вами делиться? Чтоб вы заработали? Это ж глупость, и ничего личного.
avatar
variantolog, Если найдете ошибки, то потешите свое чувство собственной важности, что вы умнее меня. 
И порадуетесь, что у меня ничего не получилось.
avatar
FZF, всегда собеседников по себе судите?
avatar
variantolog, Вы сами себя так позиционировали. Не стали по существу вопроса писать. А стали троллить. Значит для вас это более важная тема.
avatar
FZF, я «позиционировал» лишь одно — своё внимание на вашей, на мой взгляд — однобокой позиции (см. цитаты выше).

На «чувство важности» и «злорадство» вы сами перешли.
avatar
Александр Сережкин, тут надо по-Абхазски: «Мамой клэнуся...»
avatar
Кстати где вы первый график взяли? Он неверный, у БР эксцесс значительно больше.
avatar
Большой Брат, График получился из формулы. На счет правильности не гарантирую. Возможно, есть еще решение с другими параметрами. Но я его пока не нашел. Это распределение посмотрю применительно к опционам. Там сразу будет видно правильное оно или нет.
avatar
Есть два фактора, если мы рассматриваем приращения, в рамках концепции «случайного блуждания».
Первый это независимость приращений.
Второй это форма распределения независимых приращений.
Если мы принимаем первый постулат, то на рынке на линейных инструментах в принципе не возможно заработать. (за исключением тривиального случая когда у всех приращений смещено среднее, чего в реальности очевидно быть не может) Это к тому, что нет смысла уточнять второй пункт, пока «действует» первый.
avatar
vlad1024, все еще хуже
vlad1024, В казино приращения тоже в виде случайного блуждания, но это не мешает процветанию казино.
avatar
FZF, в казино, очевидно, смещение среднего для всех приращений, что в рулетке когда выпадает зеро, что в других играх (именно об этом я и сказал, уточнив про «тривиальный» случай). я бы тоже при таком раскладе на стороне казино поиграл…
avatar
Объяснить одномерные распределения приращений цен (или приращений логарифмов цен) таким путем конечно можно, но объяснить статистику 10-ти грамм приращений дневок не получится
smart-lab.ru/blog/874173.php
avatar
А. Г., но если исходить из предположения мульти-фрактальности, то есть независимости приращений на разных масштабах времени, то выбросы на «больших» масштабах времени, могут вполне давать подобный эффект )
avatar
vlad1024, тут вот какая проблема: объяснить статистику из ссылки на мой топик «выбросами» можно только, если эти «выбросы» коротки по времени (меньше 10 приращений), но часты по появлению. Не уверен, что такое поведение «выбросов» можно описать в рамках какой-нибудь мультифрактальной модели. Хотя на 100% в том, что такой мультифрактальной модели нет, я тоже не уверен.

Под «выбросами» в утверждении выше я имел ввиду участки с относительно большими колебаниями цен относительно некой линии, необязательно горизонтальной,  а не относительно «мелкие» колебания относительно разных линий.
avatar
А. Г., вот с моих чисто интуитивных представлений, если мы предполагаем наличие распределения с длинными хвостами на старших таймфреймах, то это должно порождать какое-то подобие «трендовости» на младших, таким образом давая смещение, которое в принципе может быть достаточно чтобы отбросить нуль-гипотезу.
PS: но вообще я это привел как достаточно простую по «аксиоматике» модель, которая довольно хорошо описывает реальные ценовые процессы, в том числе с взрывом волатильности, ее автокоррелляцией и длинными хвостами.
avatar
vlad1024, объяснить «тяжёлые хвосты» одномерного распределения приращений цен переменной волатильностью несложно и автор топика привел как раз такой пример. Я же говорю о другом: если дальше мы предполагаем, что имеем модель цен с независимыми приращениями дневок с таким одномерным распределением, то вступаем в противоречие с распределением 10-ти грамм приращений. И более того, с любой моделью независимых приращений с постоянным средним и «медленно меняющейся» дисперсией. И объяснить можно только отказом хотя бы  от одного из условий:

или
 постоянства среднего
или 
«медленной изменчивости» дисперсии
или
независимости приращений.

Можно отказом и сразу от нескольких. Но ситуация такова, что отказавшись от любого из этих условий мы приходим к ситуации, что одномерное распределение по всей совокупности нам бесполезно для работы.
avatar
А. Г., как мне кажется это вполне можно получить исходя из двух аксиом:
1. независимость приращений на всех масштабах времени
2. наличие длинных хвостов на каждом из этих масштабов
мне честно сложно сказать, что ломается в случаях когда мы получаем выброс на крупном масштабе, что приводит к некоторому локальному смещению среднего приращений на младшем. но с реальностью это согласуется в первом приближении довольно не плохо.

PS: скорее всего ломается независимость, но вот если заменить на измеряемую характеристику — скоррелированность на уровне статистической значимости, должно получится, наверное
avatar
vlad1024, да в принципе, если отказаться от постоянства среднего, то статистику десятиграмм для дневок можно объяснить даже в рамках нормальности и независимости отдельных приращений.
avatar
А. Г., вот мне не очевидно как можно согласовать
1. независимость приращений на всех масштабах времени
2. наличие длинных хвостов на каждом масштабе
и выбросы на старших масштабах времени, которые могу приводить к появлению смещения на младших масштабах(это можно назвать появлением «тренда», если мы далеко ушли на старшем масштабе, то на младшем нам это как-то надо «компенсировать»).
это не конструктивистская постановка, и тут вряд ли существует единственно решение.
avatar
А. Г., то что вы пишите, про то что локальные тренды можно объяснить смещением среднего, и при этом оставить нормальность и независимость, это все верно. Проблема лишь в том, что мы теряем одно из ключевых свойств — наличие длинных хвостов на всех масштабах времени. И это гораздо более фундаментальная проблема. Если мы исходим из независимости то, в среднем будет сходимость по ЦПТ, соответственно, если мы берем вдвое больший масштаб времени, то дисперсия увеличивается лишь на sqrt(2), то есть будет некоторое «сжатие», которое в реальности не наблюдается. Можно конечно уповать на модели стохастической волатильности, но с ними тоже проблемы, так как сами по себе они не дают экстремальные приращения волатильности, а лишь описывают поведение(автокорреляцию), после подобного «шока».
avatar
vlad1024, 
Проблема лишь в том, что мы теряем одно из ключевых свойств — наличие длинных хвостов на всех масштабах времени. 

Ну нормальное распределение со случайным средним — это обобщенное гиперболическое распределение  и у него могут быть любой «тяжести» хвосты до О(х^-2).
А у тиков внутри дня у ликвидных инструментов никаких «хвостов» нет. Они вообще ограниченные величины. А гэпы из-за периодов низкой ликвидности — это совсем другой случайный процесс.
avatar
А. Г., если мы считаем приращения независимыми(и с конечной дисперсией) на каком-то масштабе времени, то мы автоматом по ЦПТ получаем, на каком-то бОльшем масштабе около нормальное распределение. И рост дисперсии на этом масштабе как sqrt(t) от увеличении масштаба времени приращений, в результате хвосты должны сходится к около-нормальным, да и рост дисперсии должен быть в районе sqrt(t). В реальности же мы имеем гораздо бОльшие хвосты на всех масштабах, и дисперсия тоже скейлится не совсем как sqrt(t). Про «все масштабы» это условно, на тиках конечно такого не будет. (хотя и был такой широко известный flash crash в 2010)
avatar
vlad1024, как раз мои исследования SPY показывают,.что дисперсия приращений логарифмов  15 минуток внутри основной американской сессии меньше, чем 15*дисперсия приращений логарифмов минуток внутри сессии. Тоже самое наблюдается и у RI, если убрать дни с «планками».

Это говорит о том, что внутри дня есть периоды с отрицательной корреляцией приращений логарифмов минуток.

А вот, начиная с дневок, этого эффекта не наблюдается. И у меня этому только одно объяснение: к статистике дневок добавляются периоды низкой ликвидности между сессиями, т. е. совсем другой процесс из-за другой ликвидности.

Именно этот процесс в условиях пониженной ликвидности и создаёт «сверхтяжёлые хвосты» в интрадейных данных.
avatar
А. Г., спасибо, интересно. (вот тут «15*дисперсия»), наверное имелось ввиду sqrt(15)*дисперсия?
avatar
vlad1024, нет, имелась ввиду дисперсия, а не СКО. Дисперсия суммы независимых случайных величин равна сумме дисперсий слагаемых.
avatar
О каком случайном распределении на бирже может идти речь, при наличии инсайдеров знающих о статистике позиций большинства игроков и где у них сработают маржинколлы… Рискну предположить что при таких условиях распределение не случайно, а периоды низкой и высокой волатильность чередуются реагируя на набор плечей игроками… В интересах инсайдеров разумеется выносят на маржинколлы плечистых спекулянтов когда их становится много. Вот за счёт этого мы и получаем жирные хвосты. Но ловить их успешно можно только суммой которая не будет влиять значительно на статистику и тогда когда все расслабились на спокойном рынке и набрали плечи.
avatar
Так когда покупать?)
Спасибо за пост.
Вам для размышления: хвосты в большей степени существенны при тренде. Нарисуйте на одном графике нормальное распределение и его смещение в случае тренда — думаю, увидите что ваша формула не работает. Во всяком случае при z=const.
Владимиров Владимир, ну нормальность приращений логарифмов цен со случайными (!) средним и дисперсией косвенно подтверждается

smart-lab.ru/blog/699507.php
avatar
А. Г., Перейдя от приращения цен к их логарифмам тяжелые хвосты все равно не описать. Но я писал про другое — про тренд. В случае тренда z будет функцией минимум 2 переменных (по моим исследованиям). Но это неподъемная да и нецелесообразная задача в плане трейдинга.  
   Взгляните на первый рисунок поста. Если (в терминах поста) распределение БНР нарисовать для тренда, кривая будет смещена в сторону движения цены. Причем несимметрично как по оси X относительно «центра», так и по характеру кривой слева и справа от вершины. В моих терминах это описывается импульсом цены (естественно, в определенных предположениях).
Владимиров Владимир, ну как показано в моей ссылке, если разбить историю на кластеры волатильности, то все прекрасно описывается приведенным распределением. И при выбрасывании всего 42 дней за 18 лет, из которых 40 пришлись на кризисы — тоже описывается для приращений (!) логарифмов цен.

А на первом рисунке я вижу два симметричных распределения относительно моды.

А для того, чтобы говорить о «тренде» в контексте корневой статьи, то надо сначала определить, что это такое в терминах распределения приращений цен или приращений логарифмов цен.

Случаю отличия среднего этого распределения от нуля я посвятил другую заметку

smart-lab.ru/blog/874173.php
avatar
Мандельброта и Талеба не читали что-ли? Все это давно уже перетерто. Нормальное распределение это идеализация, как и гипотеза Башелье о случайном блуждании (а-ля эффективный рынок). Ироническая наука. Сказки для дошкольного возраста.
avatar
Чем это вообще может помочь в профитной торговле или инвестициях?
avatar
Mr Big Kos, да ничем. Это морок, бессмысленный поиск бессмысленных формул. Иллюзия точного знания там, где его нет по определению.
avatar
Рептилоид, Я про то и говорю. 
avatar
Mr Big Kos, Это смотря что вы используете в своей торговле. Если аналитику и сигналы от инфоциган, то это никак не поможет.
avatar
FZF, Ну а как это Вам то помогает? Пример хоть приведите? 
avatar
Mr Big Kos, Это помогает рассчитать цены опционов. И покупать дешево и продавать дорого тем, кто не может сделать правильную оценку стоимости.
Элементарное смещение вероятности результата в свою сторону 75:25.
avatar
FZF, Ясно. Но было бы здорово если бы был конкретный пример с конкретным опционом, а то так вообще не понятно для чего это зачем и как. Не все тут такие умные, а с опционами вообще не многие знакомы. Я например в опционах ноль. Но было бы интересно посмотреть конкретный пример.
avatar
Mr Big Kos,  Если вы плохо разбираетесь в опционах, то объяснить для чего это немного затруднительно. Но попробую
У нас торгуется сразу несколько опционов с разными страйками, на одну дату исполнения. И параллельно на другую дату исполнения тоже линейка опционов.  В идеале, цена опциона на любом страйке должна иметь нулевое матожидание (не выгодно ни покупать не продавать). Цены  опционов зависят от того как распределена вероятность. Но при этом, никто не знает как правильно посчитать цену опциона и как правильно распределена вероятность. 
Если мы знаем как распределена вероятность, то мы можем посчитать цену опциона на каждом страйке точнее, чем другие трейдеры.
Дальше приходится процесс автоматизировать. Выгружать из квика данные по опционам. Рассчитывать свои цены и сравнивать. У меня на выходе расчетов график отклонений цен опционов от «идеальной» цены

Это распределение отклонений цен по страйкам на СИ на 18:13
Синяя линия — отклонения цен опционов (в %) со сроком исполнения 16.02
Коричневая - отклонения цен опционов (в %) со сроком исполнения 22.02
Зеленая — разница между различными сроками.
В данной ситуации отклонение цены максимум на 5%. Такие варианты я не рассматриваю. Начинаю смотреть от 10-12% Иногда разница доходит до 25%.  Если меня заинтересовала разница, то лезу на опционную доску и  пытаюсь набрать позицию с минимальным риском.

В итоге, знание распределение вероятностей позволяет забирать с рынка неэффективности.
avatar
FZF, Понял. Спасибо за информацию.
avatar

Я вот чего не понял. На каком шагу, я вас спрашиваю, с поля пропала экспонента??? По шагам пожалуйста. Сдается мне что в этой статье большие проблемы с формулами и математикой.
avatar
0xFF0000FF, по свойству логарифма: степень аргумента выносится за знак логарифма.
avatar
0xFF0000FF, Для тех, кто любит экспоненту верхняя формула. По нижней быстрее идут расчеты (результат тот же) Z=0,674099272 всего девять знаков после запятой.
avatar
0xFF0000FF, e^LN(Z)=Z. В верхней формуле LN(Z) — множитель в степени.
avatar
А. Г., спасибо, откуда эта Z-константа появилась?
avatar
0xFF0000FF, вот из этого

Функция размытия r(x, б) должна быть такой, чтобы итоговая функция: 

— была близка по форме к нормальному распределению 

— имела более толстые хвосты 

— площадь ограниченная графиком должна быть равна 1 ( сумма всех вероятностей равна 1)

 Существует такая функция удовлетворяющая вышеперечисленным условиям:


Может и подбором подобрана. Я «шел другим путем»: а и  б — случайные величины со своими распределениями и пришел к обобщенному гиперболическому распределению:


avatar
Был тут, на смартлабе, года два тому назад, очень интересный чел. Тоже искатель «истинного» рыночного распределения. Его посты были подобны писаниям религиозных мистиков, кажется назывались «В поисках математического грааля» (я читал с удовольствием, кстати). Романтика, но безнадёжно (от того и романтика, что безнадёжно). Великий ум Мандельброт пытался ухватить эту ускользающую рыночную реальность с помощью фрактальных методов. Но, тщетно… Другие пытаются найти какую-то модификацию нормального распределения, которая, как им кажется, более точно описывает рынок. Но все эти модели являются идеализациями, аппроксимациями даже не всего рынка, а только какой-либо одной его фазы, которая к тому же имеет бесчисленное множество вариаций. Но герои идут вперёд…
avatar
Примечательно, что формула так называемого "нормального" распределения была выведена обезьянами (т.е. людьми) в результате наблюдений за природными явлениями. При этом, обезьяны (т.е. люди) не могут объяснить причину такого распределения. Но это не мешает им натягивать выявленную природную закономерность на самые разные места, включая совсем непотребные))

Если автор сильно ученый, то хотелось бы услышать его личное мнение относительно причины распределения. Это не касается дурацкого трейдинга. Это касается принципа работы окружающего нас мира.
avatar
$100, Причина подразумевает наличие замысла. 
Начнем с более простого. Симметричная монетка и вероятность ее падения одной или другой стороной. Полагаете что мог быть замысел, чтобы монетка падала на одну сторону в два раза чаще? И так у всех монеток? 50/50 это свойство системы монетки, которое можно изменить дополнительными техническими средствами, но не замыслом.
Еще один крутой замысел — сило ПИ.  Полагаете, что в плоском пространстве можно числу ПИ придать друге значение с помощью «великого замысла». Число ПИ — это свойство системы. Натянуть другое число на окружность вряд ли получится.
Нормальное распределение это та же монетка, только с большими степенями свободы. В определенных физических системах «монетка нормального распределения» будет падать именно так. Но  изменение системы (включением в нее дополнительных факторов) изменит функцию распределения.
На последок, можно пофантазировать про вероятностную систему, где сумма вероятностей заметно больше единицы. 
avatar

теги блога FZF

....все тэги



UPDONW
Новый дизайн