Мы уже говорили про пропуски данных на малоликвидных инструментах. Теперь надо обратить внимание на листинг и делистинг бумаг с площадки. Если не уделить данному вопросу внимание, это поставит под вопрос возможность тестирования стратегий, ориентированных на индекс.
Скачивая большие пакеты данных и выбирая бумаги по принципу «качаем все», вы неизбежно натолкнётесь на ситуацию, когда тикер был только что введён на биржу или уже снят с торгов.
Это видно в OsData в колонках «Start» / «End» / «Load %»:
Все такие инструменты надо удалить из сета данных.
Также внимание надо уделить колонке «Start» И «End».
Даты в них должны совпадать для всех инструментов. Если Вы скачаете 300 бумаг, и хоть одна будет начинаться на две недели позже, нормальные тесты и начнутся на две недели позже, чем время у остальных 299 бумаг.
То же самое касается и наборов данных для Московской биржи! Несмотря на то, что листинги и делистинги бумаг происходят здесь сильно реже, чем в Крипте. Вы должны проверить КАЖДУЮ. Чтобы каждая бумага, на которой Вы хотите вести тесты для индекса, была в истории от начала и до конца.
Как это выглядит в MOEX. Допустим мы хотим скачать ВСЕ бумаги по споту с 2020 года с серверов MOEX IIS. Так уже на первом экране у нас появляется бумага, выпавшая из торгов(ACKO):
Жмём на кнопку «Удалить». И внимательно просматриваем весь список, чтобы не было ошибок в колонках «Start» / «End» / «Load %».
Далее, например, есть тикер MGNZ, который был снят с торгов. И даже можно посмотреть, перед удалением каких именно данных и когда не было, нажав на кнопку «More info»:
Здесь же, в окне детализации пирога данных по бумаге, можно открыть файл, перейти к нему в файловую систему или попробовать очистить.
Будьте аккуратны!
Оглавление здесь: https://smart-lab.ru/company/os_engine/blog/997533.php
Подписывайтесь. Комментарии открыты для друзей.