Постов с тегом "data mining": 26

data mining


Это нужно для успешной системной торговли: обновление исторических данных

Приветствую! (Начало темы тут)

Выкладываю обновление по историческим данным:

5 минутные OHLCV

Данные по ES, GC, CL, NQ, NG с самого начала (15 и более лет)  по 08.04.2016 тут
Данные по ES, GC, CL, NQ, NG с 08.04.2016 по 15.04.2016 тут


Качественные тиковые данные

ES — c 10.09.1997 по текущий момент

CL – с 02.01.1987 по текущий момент

GC — c 03.01.1984 по текущий момент

NQ - c 01.07.1999 по текущий момент

NG —  с 04.01.1993 по текущий момент

HG – с 12.01.1989 по текущий момент

Обращайтесь в личку


Это нужно для успешной системной торговли

Каждый трейдер, путем проб и ошибок, вырабатывает свой концепт и принципы торговли. Мой путь привел меня к следующему пониманию:

  • Цены на рынке случайны
  • Рынок имеет «память» и есть зависимость распределения новых цен от прошлых

Почему я так считаю? Случайность цен состоит именно в том, что мы не можем (по крайней мере на практике) установить четкие законы изменения и не можем с 100% вероятностью рассчитать, на основании t0 тика, значение t+1, t+2…t+n. А значит мы оперируем только вероятностями. А объяснение причины случайности в том, что на рынке участвуют множество трейдеров с разными подходами и в момент t0 каждый из них принимает свое решение, что и создает случайность (т.е. невозможность однозначного расчёта будущего). А наличие «памяти» и зависимости прошлых новых цен от прошлого объясняется очень просто – любое принятие решений на рынке, трейдеры основывают на имеющихся данных, т.е. опираясь на историю, это же касается и роботов. Какие из этого я делаю выводы?

  • Рынок хоть стремиться к эффективности, но не является эффективным
  • На рынке присутствуют периоды с большей «связанностью» будущего с прошедшим (т.е. более предсказуемые)
  • Все, что у нас есть – это история. И в большей степени исторические данные по торгам. Ну, покрасней мере для простого трейдера. ИИ анализирующий другую историческую информацию нам не доступен J


( Читать дальше )

Выкладываю тиковые исторические данные

Предыстория:

Мне, и думаю многим другим, нужны качественные исторические данные за максимальный промежуток времени — для изучения рынка, построения и тестирование торговых систем. Такие данные по фьючерсам, торгуемым на западе, в частности на CME, в свободном доступе (кроме дневок) практически не найти. Несколько месяцев назад я купил исторические данные по следующим фьючерсам CME: ES (фьючерс на индекс S&P), CL (фьючерс на нефть WTI), GC (фьючерс на золото), NQ (фьючерс на индекс NASDQ). Спецификацию по ним вы можете посмотреть тут:http://www.cmegroup.com/trading/equity-index/us-index/e-mini-sandp500_contract_specifications.html

Но осталась потребность в данных по многим другим интересным инструментам. И пару недель назад у меня появилась идея – т.к. исторические данные нужные не только мне, то вполне возможно приобретать их совместно (в складчину) (http://smart-lab.ru/blog/317451.php)



( Читать дальше )

Выкладываю тиковые исторические данные

Начало тут: smart-lab.ru/blog/317925.php

5 минутные OHLCV:

ES GC CL NQ NG 5 MIN c 20.03.2016 по 25.03.2016 cloud.mail.ru/public/9XYR/WViRCsp5v

Поблагодарить

Можно плюсиками и при желании любой суммой на дальнейшие покупки на:

Тиковые данные:

По поводу «скидывания» на тиковые данные и получения всей истории обращайтесь в личку (у кого не хватает рейтинга пишите комментарий, я вам напишу в личку и она станет доступна). Цена вопроса всего 5000 рублей.

Ранее «скинувшиеся» увидят все данные (и добавленный новый контракт и дальнейшие обновления) по полученной ими ссылке

P.S.

Конструктивные комментарии и вопросы приветствуются.

Флуд, навязывания своего мнения – в топку.


Выкладываю тиковые исторические данные

Предыстория:

Мне, и думаю многим другим, нужны качественные исторические данные за максимальный промежуток времени — для изучения рынка, построения и тестирование торговых систем. Такие данные по фьючерсам, торгуемым на западе, в частности на CME, в свободном доступе (кроме дневок) практически не найти. Несколько месяцев назад я купил исторические данные по следующим фьючерсам CME: ES (фьючерс на индекс S&P), CL (фьючерс на нефть WTI), GC (фьючерс на золото), NQ (фьючерс на индекс NASDQ). Спецификацию по ним вы можете посмотреть тут: http://www.cmegroup.com/trading/equity-index/us-index/e-mini-sandp500_contract_specifications.html

Но осталась потребность в данных по многим другим интересным инструментам. И пару недель назад у меня появилась идея – т.к. исторические данные нужные не только мне, то вполне возможно приобретать их совместно (в складчину) (http://smart-lab.ru/blog/317451.php)

Суть идеи:

Для коллег, кто пользуется 5-минутками и выше, я решил выкладывать в свободный и бесплатный доступ 5 минутные OHLCV за всю историю и также выкладывать обновления по ним.



( Читать дальше )

Программа Data Mining Station для создания интрадей роботов за 5 минут

    • 24 июня 2014, 16:12
    • |
    • Svips
  • Еще
Всем доброго дня.
Попросил меня друг HPotter записать видео программы Data Mining Station с описанием интерфейса. В рамках проекта "Торговый робот каждому или заведи себе майнера". В общем не судите строго, сам с программой толком не разобрался, да и пока она сыровата.





Самообучающиеся системы в R. Random Forest vs Nearest Neighbor.

Все больше и больше нравится использовать R для поиска идей и анализа. 
Сегодня я хочу рассказать о небольшом исследовании и сравнении системы прогнозирования на основе алгоритма случайного леса и  алгоритма ближайшего соседа. 

Вопросы, которые я себе ставил были следующими:
— на сколько алгоритм Random Fores (RF) продуктивнее чем Nearest Neighbor (NN) или наоборот;
— каково влияние параметров количества случайных соседей на работу алгоритма и на сколько оно может оказаться простой подгонкой данных;
— получится ли эффективно сочетать результаты NN для маленькой и большой выборки, избавляясь тем самым от ошибки переоптимизации;
— как оценить надежность обучения;
— какой метод работает лучше, регрессионный или с формализованными ответами;
— когда проводить переобучение;

Данное исследование помогло мне ответить на некоторые вопросы. 

В качестве предикторов были использованы некоторые внутридневные метрики (10 штук) акции AAPL за один год, результатом я считал изменение цены акции от Close первой пятиминутной свечи до конца дня. Сразу скажу, предикторы мне показались неэффективными, но суть исследования, все же, была в оценке методов прогнозирования прежде всего. Я надеялся, что алгоритмы смогут выявить определенные паттерны внутри многомерного пространства и использовать их. 

( Читать дальше )

Делать русскую версию сайта managerhf.com?

    • 06 февраля 2014, 10:34
    • |
    • HPotter
  • Еще

Делать русскую версию сайта managerhf.com?

Да, было бы здорово.
Нет, мне все понятно.
Не занимайтесь ерундой, это никому не нужно.
Всего проголосовало: 40
Всем добрый день. Изначально ресурс managerhf.com планировался на западную аудиторию, и сейчас пока позиционируется так же. Но многие русскоязычные трейдеры проявили к нему реальный интерес. В связи с этим вопрос. Делать для вас русскоязычную версию сайта?

Data Mining fRTS: тренд и флет ч.2

Продолжаем изучать некоторые внутренние характеристики фРТС с помощью языка R.

Сегодня мы попробуем узнать какое в теории самое доходное время и определить общие трендовые тенденции.

Data Mining fRTS: тренд и флет ч.2 
 Табличка1:
Data Mining fRTS: тренд и флет ч.2

 Как не удивительно, но самое волатильное время очень точно пересекается со 

( Читать дальше )

OHLCV: продолжение

В прошлом посте я заявил что если вы торгуете OHLCV то я скорее всего знаю как вы зарабатываете.

Ну и чтобы не быть голословным, давно еще удалось отмайнить закономерность, существенно отличающую фРТС 2011-2013 от фРТС 2008-2010 годов.

Буквально на прошлой неделе ее и еще одну систему уже продает известный системостроитель за 300тысяч рублей.

Вот мой вариант системы:
OHLCV: продолжение 
К слову это не первая моя система которая так пересекается. Когда набор данных ограничен, все приходят к единой модели. 

....все тэги
UPDONW
Новый дизайн