Снова о главной проблеме алготрейдинга

« Март 2026 »
Пн	Вт	Ср	Чт	Пт	Сб	Вс
	1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

11 мая 2015 long-short.ru Кургузкин Александр

Не так давно я написал небольшой текст о главной проблеме алготрейдинга. Я обозначил ее как нестационарность ценового ряда. Как мне представляется, я недостаточно внятно изложил суть проблемы, поэтому постараюсь исправить это упущение сейчас.

Снова повторюсь, что речь идет о торговых стратегиях, неважно алгоритмических или дискреционных, система принятия решений которых опирается на свойства ценового ряда, взятые из определенного диапазона прошлых данных. Сейчас доступен целый арсенал средств, позволяющих вытащить некие свойства из набора данных и получить стратегию.

В формировании этих свойств принимает участие очень большое число людей, каждый из которых сегодня на рынке, а завтра может уйти, или изменить систему принятия своих решений. Таким образом, конфигурация участников, которая формирует свойства ценового ряда, постоянно меняется. С ней меняются и свойства ценового ряда.

Если мы берем кусок прошлых данных, делаем под него модель, а потом пытаемся применить эту модель на будущих данных, мы сходу делаем ошибку. Мы применяем модель, полученную на одном источнике данных, к данным, созданным другим источником. То есть в принципе другим источником. Новые данные будут создаваться другой конфигурацией других трейдеров, действующих на основе других соображений в других рыночных обстоятельствах. Корреляции, моменты распределений, любые доверительные диапазоны любых параметров - все в общем случае будет другим.

Данные с разных временных отрезков это данные разных источников. Они все сцеплены друг с другом и это может вызвать (и вызывает) иллюзию того, что это все данные одного источника, но это не так.

Когда вы создаете стратегию, вы решаете определенную задачу. Если вы понимаете эту задачу как просто восстановление зашумленного сигнала, вы решаете не ту задачу. Можете использовать хоть нейросети, хоть генетические алгоритмы, но в результате решения такой задачи вы получите модель, которая не будет годна ни для чего, кроме как использования на том куске данных, с которого вы ее получили.

Тогда как правильная задача значительно интереснее. Вам нужно восстановить свойства сигнала, имея на руках зашумленный сигнал ДРУГОГО источника данных (шум, кстати, тоже разный). Вам нужно как-то связывать свойства сигналов из разных источников, а это уже другая задача, и вам, как минимум, нужно хотя бы понимать, что это именно ее нужно решать, что без ее решения получится ерунда.

И для этого вам нужно будет опровергать нулевую гипотезу, по которой свойства сигналов из разных источников (на разных временных интервалах) никак не связаны. Причем располагаемые вами сигналы во всех случаях сильно зашумленные.

Я понимаю, что в основном трейдеры действуют на основе неявных допущений о сохранении отдельных свойств ценового ряда во времени. Или даже на основе слепой веры в существовании неких инвариантов в свойствах цены. Но по вере и воздается. И учитывает ли кто-то риски, связанные с допущениями по поводу изменчивости ценового ряда, иначе как «на глазок»?

http://www.long-short.ru/ Источник

Не является индивидуальной инвестиционной рекомендацией | При копировании ссылка обязательна | Нашли ошибку - выделить и нажать Ctrl+Enter | Жалоба