Всех с наступающим (и никаких отступлений!) Днем Защитника Отечества ака Денем Советской Армии и Военно-Морского Флота!
И за тех, кто в море! Ну а те кто в ЗОЖе, начинаем готовить себе замену — искусственного трейдера.
Важнейшей частью любого алгоритма машинного обучения являются данные, на которых происходит обучение, а еще важнее качество этих данных.
Для приготовления искусственного трейдера нам понадобятся следующие ингредиенты:
1.Установленная платформа Jatotrader (FREE или круче) версии 2.9.3 или выше. Можно обойтись и без установки Джато и взять тестовый набор данных отсюда. Описание содержимого файлов датасета — в конце топика.
2.Питон.Jupyter Notebook (Anaconda3)
Короче говоря, Jatotrader мы используем как предварительный обработчик и генератор данных для машинного обучения (МО), а Python для создания модели, обученной на этих данных. Возможности Jatotrader позволяют создавать частотные графики из тиковых данных, примерно такого вида
В конце апреля 2019 года в аэропорту Омахи приземлился «гольфстрим» компании Occidental Petroleum. Нефтяная компания направила делегацию для секретной встречи с Уорреном Баффетом, надеясь убедить его прийти на помощь против враждебного поглощения. Эта встреча недолго оставалась тайной. Работающая в области «альтернативных данных» компания под названием Quandl отслеживала подобные перелеты, что позволило ей предупредить клиентов — в основном хедж-фонды — о неожиданном полете «гольфстрима» и потенциальной сделке. Два дня спустя Occidental объявила об получении $10 млрд от Баффета.
Этот эпизод показывает, как индустрия активного управления пытается восстановить позиции на фоне многолетнего отставания как от заявленных нормативов доходности, так и от результатов пассивного индексирования. Многие традиционные хедж-фонды и управляющие паевых фондов не могут себе позволить просто наблюдать за тем, как клиентские портфели перетекают в индексные или алгоритмические стратегии. Один из способов вернуть доверие и средства инвесторов — использование интеллектуального анализа данных. Изначально такого рода методы применялись конкурентами традиционных портфельных менеджеров — «квантами», что подразумевает серьезные вложения в найм программистов и специалистов по обработке данных. Но теперь речь идет о гибридном подходе, который сочетает в себе суждения опытного портфельного управляющего и применение больших данных.
Я потратил приличное количество времени на разработку стратегий и даже имел парочку которые приносили определенный доход некоторое время. Занимался пару лет машинным обучением и тоже представляю, что это за зверь. Также работал в инвест банке где видел как роботы рубят капусту особенно во время кипишей на маркете, в такие времена прибыль просто была огромной у ХФТ.
Собственно здесь мои сбивчивые размышления на тему когда же наступит момент когда всех трейдюков заменят алгоритмы, и я думаю этот момент в конечном итоге наступит.
В начале хочу вкратце описать типичную разработку стратегии с классическим маш. Обучением – берется входной массив данных, вручную выделяются признаки-фичи которые могут быть ценны для прогноза, нормализуются, модель обучается на тестовой выборке, фичи которые имеют меньший предсказательный вес удаляются для уменьшения вероятности оверфиттинга, и увеличения робастости модели, модель снова обучается, потом проверяется на тестовом сете данных, что модель действительно работает. Вроде просто. На самом деле есть несколько проблем