Решил выложить в общий доступ базу исторических данных по основным фьючерсам биржи CME. Данные собирал на самописном софте для своих исследований.
В базе представлены данные по следующим инструментам:
— все валюты торгуемые на CME: 6A,B,C,E,S,J
— индексы: ES, NQ, YM, NKD, TK
— энергетики: CL
— металлы: GS, SI, PL, HG
— товары: ZC, ZS, ZW, ZL
— бонды: ZN, ZB
— спрэдовые инструменты, например ZWH4-ZWK4
Данные собирал на протяжении полугода, где-то с декабря 2013 года по середину 2014. Есть промежутки по некторым инструментам, но для исследований это не критично. Данные писались полностью всего потока, т.е. все изменения лимитов в стакане + трейды.
Формат данных следующий:
1) название архива соответствует тикеру инструмента
2) внутри архива содержится папка с тикером инструмента
3) внутри папки содержатся файлы формата *.txt, имя каждого файла соответствует конкретной дате (дд-мм-гггг)
4) каждый файл содержит строки определенного формата, например рассмотрим несколько строк по инструменту CL:
«A;17:57:22;11280;10090;10;6;1;»
A — изменение лимита на стороне асков; 17:57:22 — московское время данного события; 11280 — микросекунды; 10090 — цена, по которой произошло данное событие; 10 — текущее значение лимитов; 6 и 1 — внутренние флаги датафида
«B;17:57:22;12749;10087;19;16;1;»
B — изменение лимита на стороне бидов; 17:57:22 — московское время данного события; 12749 — микросекунды; 10087 — цена, по которой произошло данное событие; 19 — текущее значение лимитов; 16 и 1 — внутренние флаги датафида
«T;17:57:24;9046;10087;1;S;»
T - трейд; 17:57:24 — московское время данного события; 9046 — микросекунды; 10087 — цена, по которой произошло данное событие; 1 — текущий объем трейда; S — сторона агрессора, в данном случае это была продажа
Как видите все значения в файлах разделены между собой точкой с запятой, таким образом эти файлы легко можно загрузить в Exel, выбрав в качестве формата файла *.csv
Качество данных от фида выборочно сверялось с оригинальными данными предоставленными биржей CME, совпадение данных 100%.
База исторических данных находится здесь:
cloud.mail.ru/public/04dbf91a0453%2FCME%20Historical%20DATA
К примеру, что касается задержек, то на конец 2013 года раунд трип на cme в среднем составлял 2,8 миллисекунд, медиана была 466 микросекунд. В 2014 году инфраструктуру оптимизировали и эти цифры еще уменьшились.
для теста хфт и недели достаточно таких данных
большой плюс автору
«A;17:57:22;11280;10090;10;6;1;» тут 6 не кол-во ордеров? Т.е. 10 это объем, а 6 кол-во ордеров.
Аналогичная просьба!
Кирилл, есть возможность перезалить?