Добрый день, Уважаемые алготрейдеры!
Подход каждого алготрейдера к построению торговых стратегий индивидуален, но есть основные моменты позволяющие улучшить результаты торговли и робастность системы в целом. Одним из краеугольных элементов построения успешной торговой системы является количество и качество параметров оптимизации. Если с качеством все достаточно индивидуально, и относится скорее к принципу («паттерну») лежащему в основе стратегии, то количество параметров оптимизации можно выделить в отдельную область исследования и дать численную оценку оптимальному числу параметров.
Ни для кого не секрет, что большое количество коэффициентов в системе уравнений позволяет подобрать функции, наиболее плавно описывающие точки в исследуемом множестве. Но в сообществе трейдеров глубоко укоренилось, что избыточное число параметров приводит к переоптимизации, усложняет систему и в конечном итоге не приносит желаемого результата при торговле в out of sample.
На протяжении многих бессонных ночей, каждый из вас нарабатывал свой оптимальный подход к оценке количества и качества параметров оптимизации в торговом алгоритме. Поэтому наиболее ценно узнать ваше мнение и эмпирическую оценку в представленном опросе.
Заранее благодарен, всем кто объективно проголосует и оставит свои комментарии, касающиеся темы опроса.
Спасибо за внимание, всем удачных трейдов!
про переоптимизацию — умный текст...
Существует еще одна проблема: каждый раз, когда вы делите систему на два или более состояния, вы по определению сокращаете количество наблюдений в каждом состоянии. Чтобы проиллюстрировать это, представьте, что каждый из 37 классификаторов в моей IWM-системе имеет лишь 2 состояния – лонг или кэш. Тогда существует 2^37 = 137 млрд. возможных состояний системы. Напомним, что статистическая значимость зависит от числа наблюдений, таким образом, уменьшение количества наблюдений на состояние в системе снижает статистическую значимость наблюдаемых результатов для каждого состояния, а также для системы в целом. Например, возьмем дневную торговую систему с 20-летней историей тестирования. Если вы разделите 20 лет (~5000 дней) на 137 млрд. возможных состояний, каждое состояние будет иметь в среднем всего 5000/137 млрд. = 0,00000004 наблюдения на состояние! Очевидно, что 20 лет истории не достаточно, чтобы быть уверенным в этой системе; вам потребуется период тестирования более 3 млн. лет, чтобы получить статистический уровень значимости.
Как правило, чем больше степеней свободы имеет ваша модель, тем больше должен быть размер выборки, чтобы доказать статистическую значимость. Верно и обратное: при одинаковом размере выборки модель с меньшим числом степеней свободы, скорее всего, будет иметь более высокую статистическую значимость. В мире инвестирования, если вы смотрите на результаты бэктестирования двух инвестиционных моделей с аналогичными результатами, как правило, следует отдать предпочтение модели с меньшим числом степеней свободы. По крайней мере, можно сказать, что результаты этой модели будут иметь большую статистическую значимость, и большую вероятность того, что результаты при работе будут согласоваться с тем, что наблюдалось при тестировании.
Хорошо сказал...
И как товарищ использует эти 37 классификаторов лонг/кэш. Если он их складывает, у него всего 38 состояний, от нуля до 37.
www.long-short.ru/post/torgovaya-strategiya-na-puti-k-prostomu-retseptu-629?simple=true&