9 июня 2015 QuantAlgos
В статьях об индикаторе PIN мы определили, что на рынке присутствуют два типа трейдеров - информированные и неинформированные. Заявки неинформированных трейдеров всегда подвержены adverse selection risk со стороны информированных. Ситуация, когда после исполнения таких заявок цена движется в невыгодную для неинформированных участников сторону, называется токсичностью потока ордеров. Индикатор PIN служил для измерения этой токсичности, в данной статье мы рассмотрим усовершенствованный индикатор VPIN, который применим и для высокочастотной торговли. Цикл статей основан на публикации Maureen O’Hara "Flow Toxicity and Liquidity in a High Frequency World". Будет все описываться очень подробно, потому что, кроме нахождения непосредственно VPIN, в этой публикации много интересных выводов и фактов.
Из фундаментальных исследований о микроструктуре рынка известно, что процесс поступления ордеров информативен в отношении последующего движения цены в общем случае, и токсичности потока в частности. Извлечение этой информации, однако, затруднено из-за сложной природы высокочастотных рынков. Мы утверждаем, что в высокочастотной области привязка к сделкам более релевантна, чем привязка к текущему времени. Мы применим наши исследования к рынку фьючерсов, где информация более связана с систематическими факторами, отражающими процессы хеджирования или портфельной диверсификации.
Мы представим новую процедуру оценки токсичности потока заявок прямо и аналитически, основанную на процессе, зависимом от поступающих объемов , который назовем "синхронизированная по объемам вероятность информированной торговли" (Volume-Synchronized Probability of Informed Trading), или VPIN. Подход, основанный на VPIN, не требует промежуточной числовой оценки ненаблюдаемых параметров, как в случае с PIN, и обновляется в стохастическом времени, которое откалибровано по одинаковому объему сделок в каждый его промежуток. Таким образом, наша модель избегает трудности вычисления индикатора PIN на высокоактивных рынках и предоставляет аналитический способ измерять токсичность потока ордеров при использовании высокочастотных исходных данных.
Мы определим эмпирически статистические свойства VPIN и покажем, как объемное пакетирование ( таким образом, что каждый выбранный интервал времени содержит одинаковый объем сделок) снижает скачки волатильности (кластерность) в выборке. Так как большие движения цены ассоциируются с большими объемами, выборка по объемам является отражением выборки по волатильности. Результирующая временная серия наблюдений следует статистическому распределению, которое близко к нормальному и менее гетероскедастична, чем серии с одинаковыми временными интервалами (см. график в заглавии поста).
Применение и полезность VPIN будут демонстрироваться на фьючерсах E-mini SnP500 и фьючерсных контрактах на сырую нефть WTI . Также мы покажем, что VPIN имеет важную связь с будущей изменчивостью цены. Так как токсичность опасна для провайдеров ликвидности (маркет-мейкеров), высокие значения VPIN должны предупреждать о высокой волатильности. Мы увидим, что VPIN предсказывает краткосрочную, вызванную токсичностью, волатильность, частично связанную с большими движениями цены.
Оценка токсичности потока ордеров имеет множество практических применений. Маркет-мейкеры могут использовать VPIN в качестве инструмента управления риском в реальном масштабе времени. Применение VPIN трейдерами может ограничить успешность алгоритмов-хищников, получающих прибыль от атаки на провайдеров ликвидности. Также можно использовать VPIN для создания алгоритмов управления риском исполнения (execution control).
Модель
Микроструктурную модель рынка можно представить в виде игры между провайдерами ликвидности и трейдерами (потребителями ликвидности), которая повторяется на периодах i=1,...,I. В начале каждого периода возникает какое-либо информационное событие. События возникают независимо с вероятностью . Если это хорошие новости, то информированный трейдер знает, что в конце периода цена достигнет уровня , а если плохие, то уровня , где . Хорошие новости возникают с вероятностью , и плохие, соответственно, с вероятностью . После того, как событие возникнет, или не возникнет, торговля в этот период начинается с прибытия трейдеров в соответствии с Пуассоновским процессом и далее в течение всего периода. В периоды с возникшим информационным событием заявки от информированных трейдеров поступают с частотой . Эти трейдеры покупают при хороших новостях и продают при плохих. В каждом периоде ордера на покупку и продажу от неинформированных трейдеров поступают с частотой для каждого вида заявки. Повышенные объемы покупки или продажи трактуются как торговля на основе информации и применяются для идентификации . Число периодов, где зафиксирована повышенная активность, используются для идентификации и .
Провайдер ликвидности использует свои знания об этих параметрах для определения цены, по которой он хочет войти в длинную позицию, Bid, и цену, по которой войдет в короткую, Ask. Эти цены различны и формируют Bid-Ask Spread, так как маркетмейкер не знает, информирован его контрагент в сделке, или нет. Спред представляет собой разницу между ожидаемым значением актива при условии, что кто-то хочет купить его у провайдера ликвидности и ожидаемым значением актива при условии, что кто-то хочет продать его провайдеру на этом уровне. Эти условные ожидания различны по причине проблемы adverse selection, вызываемой возможным присутствием информированных трейдеров.
Провайдер ликвидности наблюдает за происходящими сделками и моделирует их так, если бы они следовали правилу Байеса, для обновления своих ожиданий о токсичности потока ордеров, который в нашей модели выражается через установленные параметры.Обозначим ожидания провайдера о событиях "нет новостей" (n), "плохие новости" (b) и "хорошие новости" (g) в момент времени t. В момент времени 0 он ожидает .
Для определения Bid и Ask в момент времени t , провайдер ликвидности обновляет свои ожидания в зависимости от прибытия ордера соответствующего типа. В момент времени t ожидаемое значение актива при условии произошедшей сделки до времени t равно:
где - предыдущее ожидаемое значение цены актива.
Bid в таком случае равен:
Аналогично, выражение для Ask:
Эти выражения показывают отдельные роли, которые играют прибывающие ордера от информированных и неинформированных трейдеров в отношении их влияния на цену актива. Если информированные участники отсутствуют (), то сделки не несут информации и таким образом Bid и Ask равны предыдущему значению цены. В другом случае, если нет неинформированных трейдеров (), тогда Bid и Ask равны минимальной и макимальной ценам соответственно. По этим ценам информированные трейдеры торговать не будут и торговля прекратится. В общем случае, и те и другие участники присутствуют на рынке, и тогда Bid меньше , а Ask больше, чем .
Спред между Bid и Ask в момент времени t обозначим . Тогда получим:
Ключевой компонент модели это вероятность того, что ордер поступил от информированного трейдера, называемая PIN. Эту вероятность можно вычислить следующим образом (см. статьи о PIN):
где - частота поступления всех ордеров и - частота ордеров информированных трейдеров. PIN, таким образом, мера отношения ордеров информированных трейдеров к общему потоку ордеров и выражение для спреда показывает, что это ключевой показатель для определения спреда.
Эти формулы демонстрируют идею, что провайдеры ликвидности должны правильно оценивать PIN для определения оптимальных уровней, на которых они входят в рынок. Значительные изменения PIN приводят к потерям тех маркет-мейкеров, которые не корректируют свои цены в соответствии с этим показателем.
В следующей части мы перейдем к определению VPIN, усовершенствованной и легче вычисляемой метрикой по сравнению с PIN, и найдем все его параметры.
Стандартный подход к вычислению PIN состоит в нахождении методом максимального правдоподобия ненаблюдаемых параметров описывающих стохастический процесс трейдов, и последующем вычислением PIN из этих параметров. Мы представим аналитическую оценку токсичности, не требующую промежуточного вычисления ненаблюдаемых величин. Мы обновляем нашу метрику в привязке к объемам для учета скорости прибытия новой информации на рынок. Эта метрика, которая называется VPIN, предоставляет простую оценку токсичности потока ордеров в высокочастотном окружении.
Природа информации и времени
Информация в модели последовательной торговли в общем виде представляет из себя данные, которые несут сообщение о будущем уровне цены актива. На эффективном рынке, значение цены актива отражает его полную информационную величину, в связи с тем, что информированный трейдер стремится получить прибыль от владения этой информацией. Так как маркет-мейкер может занимать как длинную, так и короткую позиции, будущие движения актива влияют на его прибыльность, и он пытается извлечь информацию из паттернов торговли. Эти его попытки отражаются в устанавливаемых уровнях бида и аска.
В высоскочастотном мире маркет-мейкер сталкивается с теми же основными проблемами, хотя временной горизонт, на котором он работает, меняет их в интересном направлении. Высокочастотный маркет-мейкер, удерживающий актив в течении минут, подвержен влиянию событий с подобной же длительностью. Эти информационные события могут иметь фундаментальные причины, но могут и отражать факторы, связанные с природой торгов на всем рынке или со спецификой предоставления ликвидности, имеющих влияние на отдельном интервале. Например, на фьючерсах, информация, которая вызывает увеличение предложения хеджирования данным контрактом, в общем влияет на цену фьючерса, и необходима для принятия решений маркет-мейкером. Это широкое определение информации означает, что события могут появлятся с некоторой частотой внутри дня и иметь различное значение для величины будущего движения цены.
Очень важным аспектом моделирования на высоких частотах является то, что сделки разделены не равными интервалами времени. Трейды приходят с нерегулярной частотой и одни важнее других, так как содержат разные информационные величины. Например, на рисунке в заглавии поста показаны графики фьючерсов Е-mini SnP500 и EUR/USD, демонстрирующие разную внутридневную сезонность. Приход новой информации на рынок вызывает волны решений, переходящие во всплески объемов. Информация, связанная с разными продуктами поступает в разное время, что генерирует различную внутридневную сезонность по объемам.
В данной работе, вместо использования календарного времени, мы применяем время по объемам. Идея состоит в том , что интервал времени между сделками коррелирует с присутствием новой информации, диктуя наш выбор вместо календарного времени. Это выглядит разумно, ведь чем больше информации, тем больше она привлекает объема в сделках. Если одна пришедшая новость генерирует в два раза больше объема сделок, чем другая, мы получим в два раза больше наблюдений, таким образом удвоив их вес в выборке.
Пакетирование по объему
Из примера выше, если мы возьмем один интервал выборки фьючерса E-mini SnP500 каждые 200 000 контрактов в прошедших сделках, то получим в среднем 9 интервалов в день. В очень активные дни мы увидим в разы больше интервалов, чем 9, а в неактивные дни - меньше. Так как фючерс на EUR/USD имеет дневной объем примерно в 10 раз меньше объема E-mini, то для получения 9 интервалов, нам нужно принять расстояние по объему между соседними интервалами в 20 000 контрактов.
Для получения выборки по объемам, мы сгруппируем последовательные сделки в пакеты с равным объемом, который определяется нами произвольно, и обозначим его буквой V. Пакет объема - это число сделок с общим объемом V. Если в последней сделке для комплектации пакета объема больше, чем нужно, лишний объем уходит в следующий пакет. Обозначим - индекс пакета. Разбиение на пакеты позволит нам разделить торговую сессию на периоды сравнимого информационного содержания, в которых разница объемов несет значимое экономическое влияние на провайдеров ликвидности.
Синхронизированная по объему вероятность информированной торговли (VPIN)
Стандартная модель PIN использует только число покупок и продаж для извлечения знания об информационной структуре торгов, и не применяет значение объема. На высокочастотных рынках получение числа сделок проблематично. Возвращаясь к теоретическому нахождению PIN, нам требуется информация о намерениях информированных и неинформированных трейдеров. Связь между торговыми намерениями и транзакциями на рынке очень зашумлена, так как намерения могут быть разделены на много частей для уменьшения воздействия на цену, один ордер может произвести много сделок, и несущие информацию сделки могут происходить через разные типы ордеров. По этим причинам, мы обрабатываем каждую сделку, как если бы она была суммой сделок с минимальным объемом ( например, сделка на 5 контрактов по некоторой цене p представляется как 5 сделок по 1 контракту, каждый по цене p). Это допущение учитывает интенсивность в нашем анализе.
Для каждого интервала ожидаемый торговый дисбаланс и ожидаемое общее число сделок (символы S и B означают продажу и покупку соответственно). Пакетирование по объему позволяет нам получить эти значения очень просто. В частности, вспомним, что мы разделили торговый день на равные по объему временные интервалы и вывели каждый пакет объема как эквивалент пришедшей информации. Это означает, что постоянно и равно V, для всех . Тогда мы аппроксимируем торговый дисбаланс средним торговым дисбалансом из n пакетов.
Из величин вычисленных выше, мы можем получить синхронизированную по объему вероятность информированной торговли - VPIN метрика токсичности потока заявок:
Нахождение VPIN требует выбора V, объема в каждом пакете, и n, числа пакетов, используемого для аппроксимации ожидаемого торгового дисбаланса. Для нашего примера, выберем V как одну пятидесятую от среднего дневного объема. Если затем мы установим n=50, то мы будем вычислять VPIN по 50 пакетам, которая в день среднего объема будет соответствовать нахождению дневного VPIN. Наши резельтаты робастны для широкого выбора значений V и n, что мы покажем позднее.
VPIN обновляется после прихода каждого пакета объема. Таким образом, когда 51 пакет заполнен, мы отбрасываем 1 пакет и вычисляем новый PIN по пакетам 2-51. Мы обновляем метрику в привязке к объемам по двум причинам. Во-первых мы хотим, чтобы скорость обновления соотвествовала скорости, с которой информация прибывает на рынок. Мы используем объем в качестве посредника для меры поступления информации, чтобы добиться этой цели. Во-вторых, мы хотим, чтобы каждое обновление было основано на сравнимых количествах информации. Объем может быть очень разным в течение сегментов торговой сессии, и сегменты с низким объемом могут не содержать новой информации. Таким образом, обновление VPIN в привязке к равным интервалам времени может привести к обновлениям с гетерогенным количеством информации.
Для примера, возьмем торги фьючерсом E-mini SnP500 на 6 мая 2010 года. Объем в этот день (напомним, имел место большой обвал котировок) был экстремально высоким, так что наш алгоритм произвел 137 вычислений VPIN , сравните с 50 оценками в день со средним объемом. Так как наш размер выборки равен 50, временной интервал для одного значения VPIN на 6 мая 2010 года был всего несколько часов, сравнивая с 24 часами в средний день. На графике ниже показано, как временные интервалы становятся эластичными, соответствуя интенсивности торгов ( посредника для меры прибытия информации). В 9:30 данные, используемые для вычисления VPIN занимают почти целый день. После открытия биржи 6.05.2010 наш алгоритм обновляет VPIN более часто, основываясь на более коротких временных интервлах. В 12:17 период вычисления составляет только полдня. Отметим, что уменьшение временного периода не приводит к зашумлению оценок, изменения VPIN следуют продолжительному тренду. Причина состоит в том, что объемное пакетирование производит сравнимые количества информации для каждого обновления.
Модели GARCH являются альтернативным способом работы в условиях кластерности волатильности высокочастотных данных, разделенных на временные интервалы. Применение объемного пакетирования уменьшает такую кластерность, так как получаемая оценка основана на интервалах с равным объемом.В связи с тем, что большие движения цены ассоциируются с большими объемами торгов, разбиение по объемам может рассматриваться, как разбиение по волатильности. В результате статистическое распределение набора наблюдений ближе к нормальному и менее гетероскедастично, чем при разделении на равные временные интервалы. Таким образом, применение объемного пакетирования является простой альтернативой использованию моделей GARCH.
Для проверки робастности нашего вычисления VPIN мы продемонтрируем применение этой метрики для двух наиболее активно торгуемых фьючерсных контрактов : E-mini SnP500 (торгуемый на СМЕ) и фьючерс на сырую нефть WTI (торгуемый на NYMEX). Выборка взята на интервале с 1 января 2008 года по 6 июня 2011 года, сшитая по точкам наибольшего объема в дни экспираций. Размер пакета возьмем равным 1/50 от среднего дневного объема нашей выборки (V). Параметры вычисляются в скользящем окне размером n=50 ( что эквивалентно одному среднему дню по объему).
SnP500
На графике в заглавии поста показан ценовой график фьючерса E-mini SnP500 и его метрики VPIN. Метрика токсичности в основном стабильна, хотя и демонстрирует значительную волатильность. Отметим, что VPIN достигает наивысшего уровня в выборке 6 мая 2010 года, когда на бирже произошел большой обвал котировок. Такой высокий уровень VPIN согласован с потоком ордеров, который был большей частью односторонним в это время. Такая исключительная токсичность приводит к тому, что некоторые маркет мейкеры вынуждены потреблять ликвидность, вместо того, чтобы предоставлять ее и в итоге прекращают свои операции на рынке.
Более поздний эпизод экстремальной токсичности случился после японского землетрясения. Хотя землетрясение и цунами произошло ранним утром 11 марта 2011 года, больщих ценовых движений не было до аварии на Фукусиме 14 марта 2011 года. В этот день на SnP500 зарегистрирован еще один экстремальный уровень токсичности потока ордеров. В отличие от 6 мая 2010 года, обвал произошел на слабых объемах, в ночную сессию. После сделок всего лишь на 287 360 контрактов, индекс потерял около 2,5% его цены. На графике ниже видно, что кумулятивная функция распределения VPIN (CDF) была на уровне 0,97 в 3 часа дня, демонстрируя, что токсичность потока также может иметь место в моменты сниженной активности торгов.
Фьючерс на сырую нефть WTI
Нефть является наиболее активно торгующимся сырьевым активом, и ее стратегическая роль в мировой экономике делает ее идеальным инструментом для макроэкономических ставок. Энергетические фьючерсы также являются активом, где маркет мейкеры сталкиваются с экстремально большой волатильностью потока ордеров. Как показано на графике ниже, наивысшая токсичность потока наблюдалась также 6 мая 2010 года. Такое поведение согласуется с тем фактом, что в связи с тем, что обвал 6 мая не был связан с энергетическими активами, фьючерсы на нефть подверглись влиянию токсичности с других рынков. В следующий раз высокий уровень токсичности для этого контракта был достигнут 5 мая 2011 года.
В этот день была отмечена самая большая по объему длинная позиция в истории по сырьевым инструментам. Некоторые трейдеры решили зафиксировать прибыль именно 5 мая. Для выхода из своих больших позиций им пришлось искать ликвидность, но маркет мейкеры заметили давление продавцов и стали уходить с рынка, что привело к увеличению концентрации потока токсичности в общем объеме торгов. На графике ниже показано, что в 9:53 утра кумулятивная функция распределения VPIN пересекла уровень 0,9 и осталась там до конца дня. В течение этого периода WTI потерял около 8 %.
Токсичность потока и предсказание будущей цены
На высокочасстотном рынке маркет мейкеры могут использовать VPIN для измерения токсичности потока ордеров. Так как токсичность влияет на их прибыль, она должна также влиять и на поведение маркет мейкеров. В этом разделе мы установим связь между токсичностью и будущим движением цены.
Маркет мейкеру необходимо знать, как токсичность влияет на поведение цены, пока он удерживает открытую позицию. Маркет мейкеры ищут возможность перевернуть свои позиции много раз за день, но как часто они смогут это сделать, зависит от объема сделок. Таким образом, два вопроса актуальны для провайдера ликвидности. Первый - как высокая токсичность влияет на поведение цены в период удержания позиции? И второй - как длительность состояния высокой токсичности влияет на цену?
Чтобы ответить на эти вопросы, нужно исследовать взаимосвязи между токсичностью, ликвидностью и волатильностью.Сначала рассмотрим отношения между токсичностью и движением цены в последовательных объемных пакетах. Затем сравним, как длительность токсичности влияет на приращение цены на протяженных интервалах. В общем, мы знаем, что при увеличении токсичности маркет мейкеры сталкиваются с повышенными рисками и могут сократить свое присутствие на рынке или вовсе его покинуть. Это снижение ликвидности, в свою очередь, свидетельствует, что высокие значения VPIN ведут к большей изменчивости цены.
Поверхность корелляции
Начнем с простого вопроса: коррелирована ли метрика VPIN с будущим движением цены? Для измерения этого отношения используем корелляцию Пирсона между натуральным логарифмом VPIN и абсолютным приращением цены в следующем пакете:
, где - индекс объемного пакета.
Так как VPIN может определяться с применением различных комбинаций числа пакетов за один день и длины выборки, мы исследуем как эти оценочные параметры влияют на взаимоотношение метрики VPIN и будущего приращения цены.
Для фьючерса SnP500 VPIN положительно кореллирован с будущей волатильностью цены. Это отношение изображено на графике ниже, где каждая точка вычислена с использованием больших выборок - более 44 000 наблюдений. График показывает, что корелляция между VPIN и следующим абсолютным приращением цены плавно изменяется с разными величинами параметров. В общем, увеличение длины выборки приводит к увеличению корелляции, также как и увеличение числа пакетов за день.
Комбинация (50,250) похоже разумный выбор для этого контракта, и он имеет простую интерпретацию, как "данные за одну неделю" (50 объемных пакетов в день и 5 торговых дней). Для этой комбинации находим корелляцию на 44537 наблюдениях. Рассмотренный график показывает небольшое преимущество при этих параметрах, и существует широкий спектр комбинаций с похожей предсказательной силой.
Данный рисунок представляет собой график приращений цены фьючерса E-mini SnP500 в следующем пакете объема (1/50 среднего объема дня, используя комбинацию (50,250)), отсортированных по предыдущему уровню VPIN. График расширяется по вертикали при росте VPIN, иллюстрируя тот факт, что чем выше уровень токсичности, тем больше абсолютные приращения цены.
Данные выводы в терминах корелляции показательны, но простая корелляция это грубый критерий для зависимости. VPIN демонстрирует значительную серийную корелляцию, которая делает эти выводы спорными. Другой альтернативой может быть создание временной модели совместного процесса VPIN и приращений цены. Но наш подход заключается в группировании выборок по объемам, что затрудняет применение такой модели. Мы создадим безмодельный фреймворк для нахождения зависимостей, основанный на условных вероятностях. Для этого зададим два фундаментальных вопроса: 1) Когда VPIN высок, каково поведение последующих приращений цены? 2) Когда приращения цены велики, каков предыдущий уровень VPIN?
Условные вероятности
Для получения условных вероятностей, упомянутых нами в конце части 3, нужно вычислить совместное распределение VPIN и абсолютных приращений. Для этого сгруппируем VPINы c 5% шагом и абсолютные приращения в отрезки по 0,25%, чтобы отобразить дискретные распределения. Затем получим совместное распределение . Из этого совместного распределения выведем два распредения условной вероятности.
Сначала рассмотрим распределение абсолютных приращений в следущем пакете объема при условии нахождения VPIN в каждом из наших двадцати 5% отрезков (перцентилей). Результаты в виде 20 условных распределений, одно на каждый 5%-й отрезок, показаны в таблице ниже. Каждая строка в таблице представляет условное распределение абсолютных приращений, при условии предыдущего уровня VPIN.
Отметим три важных результата. Первое, когда VPIN низкий, последующие приращения также небольшие. В частности, когда VPIN в нижней четверти распределения, абсолютные приращения находятся в области от 0% до 0,25% в течение 90% времени. Второе, когда VPIN высок, условное распределение приращений имеет много больший разброс. В частности, большие абсолютные приращения (более 1,5%) иногда возникают в следующем объемном пакете, в отличие от случая, когда VPIN очень низок. Третье, даже для высоких уровней VPIN, абсолютные приращения в следующем пакете чаще небольшие. Мы вернемся к разбору этой ситуации ниже, где увидим, что высокие уровни VPIN должны держаться определенный период, для генерации больших приращений цены.
В последующей таблице мы исследуем распределение VPIN в пакете при условии абсолютных приращений между пакетом и . Каждый столбец таблицы представляет распределение предыдущего VPIN при условии нахождения абсолютных приращений в каждом отрезке по 0,25%. Важный результат здесь, это то, что когда приращения большие , предыдущий VPIN редко бывает низким. В частности, верхняя четверть этого распределения содержит более 84% всех приращений более 0,75%. Этот факт предполагает, что VPIN имеет некоторую страховую величину против экстремальных значений ценовой волатильности. Для вычисления этих условных вероятностей мы используем нашу стандартную (50,250) комбинацию. Этот выбор параметров максимизирует корелляцию между VPIN и абсолютными приращениями, но необязательно максимизирует "сценарий риска" , например, . Рисунок в заглавии поста показывает эффект выбора параметров страховой величины VPIN против абсолютных приращений более 0,75%.
График показывает, что пока число пакетов в день не является экстремально большим и длина выборки не слишком мала, вероятность, что VPIN был в верхней четверти распределения на один пакет ранее перед более чем 0,75% абсолютным приращением, будет от 80 до 90%. Этот результат означает, что VPIN предугадывает большие пропорции случаев экстремальной волатильности, а также, что индуцированная токсичностью волатильность является значительным источником общей волатильности.
Всегда ли экстремальные уровни волатильности возникают при высоком VPIN?
Из таблиц выше мы видим, что большие приращения не обязательно возникают в следующем пакете, если VPIN высок. По факту, большинство абсолютных приращений, следующих за высоким уровнем VPIN, имеют небольшую величину. Это наблюдение, тем не менее, согласуется с нашим предположением, что длительные высокие уровни VPIN ведут к волатильности цены. Для исследования этого утверждения, нам нужно рассчитать макимальную величину волатильности, которую должен установить маркет-мейкер, когда VPIN достигнет некоего критического уровня и останется на нем, или пойдет выше. Обвал рынка в 2008 году является яркой иллюстрацией, почему различие между мгновенной волатильностью и последующим уровнем волатильности так важно. В момент обвала VPIN оставался высоким перед падением цен и после его конца, а затем цены начали частичное восстановление. Если мы сфокусируемся на периоде начала падения, когда VPIN достиг высокого уровня до момента, когда он начал снижаться, то увидим, что за этот период падение цены было небольшим. Этот факт неприятен для маркет мейкеров, которые покинули рынок в момент обвала. Они были подвержены влиянию мгновенной волатильности , которая произошла, когда VPIN имел высокий уровень.
Чтобы исследовать максимальную мгновенную волатильность, воздействующую на маркет мейкера, когда VPIN пред этим был большим, мы вычислим волатильность при нахождении VPIN в каждом из 5% интервалов. Каждый раз, когда VPIN переходит от одного 5% интервала к другому, мы вычисляем наибольшее абсолютное приращение между мгновенными двумя (не обязательно соседними) пакетами, пока VPIN переходит в следующий 5% интервал. Например, представьте, что VPIN переходит от 85% через 4 пакета до 90 %. Мы вычисляем абсолютное приращение между пакетами 1 и 2, 1 и 3, 1 и 4, также как и между 2 и 3, 2 и 4 и 3 и 4. Нас интересует максимальное приращение из этих, которое мы рассматриваем как максимальную волатильность, с которой сталкивается маркет мейкер. Мы делаем это для каждого перехода VPIN.
Для точности, обозначим i индекс, который обновляется каждый раз, как VPIN переходит из одного интервала в другой, и - пакет, ассоциированный с индексом i. Это означает, что VPIN остается в том же интервале для пакетов , в нашем примере это был период из 4 пакетов, в котором VPIN оставался в 85 перцентиле. Наибольшее абсолютное приращение между двумя любыми пакетами, пока VPIN остается в указанном интервале обозначим:
В нашем примере выше это приращение является максимумом из шести приращений внутри интервала, где VPIN остается в 85 перцентиле.
Этот анализ более емкий, чем условные вероятности, показанные в первой таблице, по двум соображениям. Первое, мы не сравниваем абсолютные приращения, которые появляются немедленно за переходом VPIN из одного перецентиля в другой, а берем максимальное приращение, пока VPIN находится в одном интервале. Это согласуется с микроструктурной теорией, что волатильность возникает когда токсичность достигает порога, который превышает "терпимость" маркет мейкера. Второе, анализ считает ценовую волатильность по всем последовательностям внутренних пакетов, что позволяет учесть эффект дрифта цены , так же, как и восстановление цены к прежним уровням. Это важно, потому что медленные дрифты цены и ее восстановление могут скрывать экстремальную волатильность. Но этот анализ также ограничен в том, что он не учитывает продолжительные периоды роста токсичности, охватывающие множество перцентилей VPIN. В частности, мы не видим, что происходит, когда токсичность увеличивается сначала с 75% до 80%, а затем до 85% и 90% и т.д. Таким образом, эта проблема приводит к недооценке эффекта волатильности, индуцированной токсичностью.
На графике выше изображены вероятности наибольшего абсолютного приращения более 0,75%, пока VPIN остается в любом из 5% интервалов в верхней четверти распределения (то есть в интервалах 0,75-0,8; 0,8-0,85; 0,85-0,9; 0,9-0,95; 0,95-1,0) для различных комбинаций числа пакетов в день и длины выборки. Для нашей стандартной комбинации (50,250) мы нашли, что 51,84% времени VPIN входит в 5% интервал верхней четверти распределения , где хотя бы одно внутренне приращение превосходит 0,75% перед тем. как VPIN покинет этот интервал. Комбинация параметров, которая максимизирует предсказательную способность VPIN равна (10,350), то есть 10 пакетов в день при длине выборки 350 (около 1,6 месяца).
Заключение
В данном цикле статей мы показали, что VPIN имеет значительную предсказательную способность для индуцированной токсичностью волатильности и предоставляет некую "страховку" маркет мейкеру относительно будущих высоких приращений цены актива. Это свойство делает VPIN средством риск-менеджмента в мире высокочастотной торговли. Предоставление ликвидности это сложный процесс, и уровни токсичности влияют на масштаб и области активности маркет мейкеров. Высокие уровни VPIN сигнализируют о высоком риске большого последующего движения цены, исходя из эффекта воздействия токсичности на предоставление ликвидности. Этот связанный с ликвидностью риск очень важен для маркет мейкеров, прямо подверженных эффектам токсичности, но и для других трейдеров, кто сталкивается с большими движениями цен, возникающими из-за этих эффектов. Создание алгоритмов, которые варьируют свои паттерны исполнения в зависимости от уровня токсичности, поможет избежать трейдерам воздействия подобных рисков.
Из фундаментальных исследований о микроструктуре рынка известно, что процесс поступления ордеров информативен в отношении последующего движения цены в общем случае, и токсичности потока в частности. Извлечение этой информации, однако, затруднено из-за сложной природы высокочастотных рынков. Мы утверждаем, что в высокочастотной области привязка к сделкам более релевантна, чем привязка к текущему времени. Мы применим наши исследования к рынку фьючерсов, где информация более связана с систематическими факторами, отражающими процессы хеджирования или портфельной диверсификации.
Мы представим новую процедуру оценки токсичности потока заявок прямо и аналитически, основанную на процессе, зависимом от поступающих объемов , который назовем "синхронизированная по объемам вероятность информированной торговли" (Volume-Synchronized Probability of Informed Trading), или VPIN. Подход, основанный на VPIN, не требует промежуточной числовой оценки ненаблюдаемых параметров, как в случае с PIN, и обновляется в стохастическом времени, которое откалибровано по одинаковому объему сделок в каждый его промежуток. Таким образом, наша модель избегает трудности вычисления индикатора PIN на высокоактивных рынках и предоставляет аналитический способ измерять токсичность потока ордеров при использовании высокочастотных исходных данных.
Мы определим эмпирически статистические свойства VPIN и покажем, как объемное пакетирование ( таким образом, что каждый выбранный интервал времени содержит одинаковый объем сделок) снижает скачки волатильности (кластерность) в выборке. Так как большие движения цены ассоциируются с большими объемами, выборка по объемам является отражением выборки по волатильности. Результирующая временная серия наблюдений следует статистическому распределению, которое близко к нормальному и менее гетероскедастична, чем серии с одинаковыми временными интервалами (см. график в заглавии поста).
Применение и полезность VPIN будут демонстрироваться на фьючерсах E-mini SnP500 и фьючерсных контрактах на сырую нефть WTI . Также мы покажем, что VPIN имеет важную связь с будущей изменчивостью цены. Так как токсичность опасна для провайдеров ликвидности (маркет-мейкеров), высокие значения VPIN должны предупреждать о высокой волатильности. Мы увидим, что VPIN предсказывает краткосрочную, вызванную токсичностью, волатильность, частично связанную с большими движениями цены.
Оценка токсичности потока ордеров имеет множество практических применений. Маркет-мейкеры могут использовать VPIN в качестве инструмента управления риском в реальном масштабе времени. Применение VPIN трейдерами может ограничить успешность алгоритмов-хищников, получающих прибыль от атаки на провайдеров ликвидности. Также можно использовать VPIN для создания алгоритмов управления риском исполнения (execution control).
Модель
Микроструктурную модель рынка можно представить в виде игры между провайдерами ликвидности и трейдерами (потребителями ликвидности), которая повторяется на периодах i=1,...,I. В начале каждого периода возникает какое-либо информационное событие. События возникают независимо с вероятностью . Если это хорошие новости, то информированный трейдер знает, что в конце периода цена достигнет уровня , а если плохие, то уровня , где . Хорошие новости возникают с вероятностью , и плохие, соответственно, с вероятностью . После того, как событие возникнет, или не возникнет, торговля в этот период начинается с прибытия трейдеров в соответствии с Пуассоновским процессом и далее в течение всего периода. В периоды с возникшим информационным событием заявки от информированных трейдеров поступают с частотой . Эти трейдеры покупают при хороших новостях и продают при плохих. В каждом периоде ордера на покупку и продажу от неинформированных трейдеров поступают с частотой для каждого вида заявки. Повышенные объемы покупки или продажи трактуются как торговля на основе информации и применяются для идентификации . Число периодов, где зафиксирована повышенная активность, используются для идентификации и .
Провайдер ликвидности использует свои знания об этих параметрах для определения цены, по которой он хочет войти в длинную позицию, Bid, и цену, по которой войдет в короткую, Ask. Эти цены различны и формируют Bid-Ask Spread, так как маркетмейкер не знает, информирован его контрагент в сделке, или нет. Спред представляет собой разницу между ожидаемым значением актива при условии, что кто-то хочет купить его у провайдера ликвидности и ожидаемым значением актива при условии, что кто-то хочет продать его провайдеру на этом уровне. Эти условные ожидания различны по причине проблемы adverse selection, вызываемой возможным присутствием информированных трейдеров.
Провайдер ликвидности наблюдает за происходящими сделками и моделирует их так, если бы они следовали правилу Байеса, для обновления своих ожиданий о токсичности потока ордеров, который в нашей модели выражается через установленные параметры.Обозначим ожидания провайдера о событиях "нет новостей" (n), "плохие новости" (b) и "хорошие новости" (g) в момент времени t. В момент времени 0 он ожидает .
Для определения Bid и Ask в момент времени t , провайдер ликвидности обновляет свои ожидания в зависимости от прибытия ордера соответствующего типа. В момент времени t ожидаемое значение актива при условии произошедшей сделки до времени t равно:
где - предыдущее ожидаемое значение цены актива.
Bid в таком случае равен:
Аналогично, выражение для Ask:
Эти выражения показывают отдельные роли, которые играют прибывающие ордера от информированных и неинформированных трейдеров в отношении их влияния на цену актива. Если информированные участники отсутствуют (), то сделки не несут информации и таким образом Bid и Ask равны предыдущему значению цены. В другом случае, если нет неинформированных трейдеров (), тогда Bid и Ask равны минимальной и макимальной ценам соответственно. По этим ценам информированные трейдеры торговать не будут и торговля прекратится. В общем случае, и те и другие участники присутствуют на рынке, и тогда Bid меньше , а Ask больше, чем .
Спред между Bid и Ask в момент времени t обозначим . Тогда получим:
Ключевой компонент модели это вероятность того, что ордер поступил от информированного трейдера, называемая PIN. Эту вероятность можно вычислить следующим образом (см. статьи о PIN):
где - частота поступления всех ордеров и - частота ордеров информированных трейдеров. PIN, таким образом, мера отношения ордеров информированных трейдеров к общему потоку ордеров и выражение для спреда показывает, что это ключевой показатель для определения спреда.
Эти формулы демонстрируют идею, что провайдеры ликвидности должны правильно оценивать PIN для определения оптимальных уровней, на которых они входят в рынок. Значительные изменения PIN приводят к потерям тех маркет-мейкеров, которые не корректируют свои цены в соответствии с этим показателем.
В следующей части мы перейдем к определению VPIN, усовершенствованной и легче вычисляемой метрикой по сравнению с PIN, и найдем все его параметры.
Стандартный подход к вычислению PIN состоит в нахождении методом максимального правдоподобия ненаблюдаемых параметров описывающих стохастический процесс трейдов, и последующем вычислением PIN из этих параметров. Мы представим аналитическую оценку токсичности, не требующую промежуточного вычисления ненаблюдаемых величин. Мы обновляем нашу метрику в привязке к объемам для учета скорости прибытия новой информации на рынок. Эта метрика, которая называется VPIN, предоставляет простую оценку токсичности потока ордеров в высокочастотном окружении.
Природа информации и времени
Информация в модели последовательной торговли в общем виде представляет из себя данные, которые несут сообщение о будущем уровне цены актива. На эффективном рынке, значение цены актива отражает его полную информационную величину, в связи с тем, что информированный трейдер стремится получить прибыль от владения этой информацией. Так как маркет-мейкер может занимать как длинную, так и короткую позиции, будущие движения актива влияют на его прибыльность, и он пытается извлечь информацию из паттернов торговли. Эти его попытки отражаются в устанавливаемых уровнях бида и аска.
В высоскочастотном мире маркет-мейкер сталкивается с теми же основными проблемами, хотя временной горизонт, на котором он работает, меняет их в интересном направлении. Высокочастотный маркет-мейкер, удерживающий актив в течении минут, подвержен влиянию событий с подобной же длительностью. Эти информационные события могут иметь фундаментальные причины, но могут и отражать факторы, связанные с природой торгов на всем рынке или со спецификой предоставления ликвидности, имеющих влияние на отдельном интервале. Например, на фьючерсах, информация, которая вызывает увеличение предложения хеджирования данным контрактом, в общем влияет на цену фьючерса, и необходима для принятия решений маркет-мейкером. Это широкое определение информации означает, что события могут появлятся с некоторой частотой внутри дня и иметь различное значение для величины будущего движения цены.
Очень важным аспектом моделирования на высоких частотах является то, что сделки разделены не равными интервалами времени. Трейды приходят с нерегулярной частотой и одни важнее других, так как содержат разные информационные величины. Например, на рисунке в заглавии поста показаны графики фьючерсов Е-mini SnP500 и EUR/USD, демонстрирующие разную внутридневную сезонность. Приход новой информации на рынок вызывает волны решений, переходящие во всплески объемов. Информация, связанная с разными продуктами поступает в разное время, что генерирует различную внутридневную сезонность по объемам.
В данной работе, вместо использования календарного времени, мы применяем время по объемам. Идея состоит в том , что интервал времени между сделками коррелирует с присутствием новой информации, диктуя наш выбор вместо календарного времени. Это выглядит разумно, ведь чем больше информации, тем больше она привлекает объема в сделках. Если одна пришедшая новость генерирует в два раза больше объема сделок, чем другая, мы получим в два раза больше наблюдений, таким образом удвоив их вес в выборке.
Пакетирование по объему
Из примера выше, если мы возьмем один интервал выборки фьючерса E-mini SnP500 каждые 200 000 контрактов в прошедших сделках, то получим в среднем 9 интервалов в день. В очень активные дни мы увидим в разы больше интервалов, чем 9, а в неактивные дни - меньше. Так как фючерс на EUR/USD имеет дневной объем примерно в 10 раз меньше объема E-mini, то для получения 9 интервалов, нам нужно принять расстояние по объему между соседними интервалами в 20 000 контрактов.
Для получения выборки по объемам, мы сгруппируем последовательные сделки в пакеты с равным объемом, который определяется нами произвольно, и обозначим его буквой V. Пакет объема - это число сделок с общим объемом V. Если в последней сделке для комплектации пакета объема больше, чем нужно, лишний объем уходит в следующий пакет. Обозначим - индекс пакета. Разбиение на пакеты позволит нам разделить торговую сессию на периоды сравнимого информационного содержания, в которых разница объемов несет значимое экономическое влияние на провайдеров ликвидности.
Синхронизированная по объему вероятность информированной торговли (VPIN)
Стандартная модель PIN использует только число покупок и продаж для извлечения знания об информационной структуре торгов, и не применяет значение объема. На высокочастотных рынках получение числа сделок проблематично. Возвращаясь к теоретическому нахождению PIN, нам требуется информация о намерениях информированных и неинформированных трейдеров. Связь между торговыми намерениями и транзакциями на рынке очень зашумлена, так как намерения могут быть разделены на много частей для уменьшения воздействия на цену, один ордер может произвести много сделок, и несущие информацию сделки могут происходить через разные типы ордеров. По этим причинам, мы обрабатываем каждую сделку, как если бы она была суммой сделок с минимальным объемом ( например, сделка на 5 контрактов по некоторой цене p представляется как 5 сделок по 1 контракту, каждый по цене p). Это допущение учитывает интенсивность в нашем анализе.
Для каждого интервала ожидаемый торговый дисбаланс и ожидаемое общее число сделок (символы S и B означают продажу и покупку соответственно). Пакетирование по объему позволяет нам получить эти значения очень просто. В частности, вспомним, что мы разделили торговый день на равные по объему временные интервалы и вывели каждый пакет объема как эквивалент пришедшей информации. Это означает, что постоянно и равно V, для всех . Тогда мы аппроксимируем торговый дисбаланс средним торговым дисбалансом из n пакетов.
Из величин вычисленных выше, мы можем получить синхронизированную по объему вероятность информированной торговли - VPIN метрика токсичности потока заявок:
Нахождение VPIN требует выбора V, объема в каждом пакете, и n, числа пакетов, используемого для аппроксимации ожидаемого торгового дисбаланса. Для нашего примера, выберем V как одну пятидесятую от среднего дневного объема. Если затем мы установим n=50, то мы будем вычислять VPIN по 50 пакетам, которая в день среднего объема будет соответствовать нахождению дневного VPIN. Наши резельтаты робастны для широкого выбора значений V и n, что мы покажем позднее.
VPIN обновляется после прихода каждого пакета объема. Таким образом, когда 51 пакет заполнен, мы отбрасываем 1 пакет и вычисляем новый PIN по пакетам 2-51. Мы обновляем метрику в привязке к объемам по двум причинам. Во-первых мы хотим, чтобы скорость обновления соотвествовала скорости, с которой информация прибывает на рынок. Мы используем объем в качестве посредника для меры поступления информации, чтобы добиться этой цели. Во-вторых, мы хотим, чтобы каждое обновление было основано на сравнимых количествах информации. Объем может быть очень разным в течение сегментов торговой сессии, и сегменты с низким объемом могут не содержать новой информации. Таким образом, обновление VPIN в привязке к равным интервалам времени может привести к обновлениям с гетерогенным количеством информации.
Для примера, возьмем торги фьючерсом E-mini SnP500 на 6 мая 2010 года. Объем в этот день (напомним, имел место большой обвал котировок) был экстремально высоким, так что наш алгоритм произвел 137 вычислений VPIN , сравните с 50 оценками в день со средним объемом. Так как наш размер выборки равен 50, временной интервал для одного значения VPIN на 6 мая 2010 года был всего несколько часов, сравнивая с 24 часами в средний день. На графике ниже показано, как временные интервалы становятся эластичными, соответствуя интенсивности торгов ( посредника для меры прибытия информации). В 9:30 данные, используемые для вычисления VPIN занимают почти целый день. После открытия биржи 6.05.2010 наш алгоритм обновляет VPIN более часто, основываясь на более коротких временных интервлах. В 12:17 период вычисления составляет только полдня. Отметим, что уменьшение временного периода не приводит к зашумлению оценок, изменения VPIN следуют продолжительному тренду. Причина состоит в том, что объемное пакетирование производит сравнимые количества информации для каждого обновления.
Модели GARCH являются альтернативным способом работы в условиях кластерности волатильности высокочастотных данных, разделенных на временные интервалы. Применение объемного пакетирования уменьшает такую кластерность, так как получаемая оценка основана на интервалах с равным объемом.В связи с тем, что большие движения цены ассоциируются с большими объемами торгов, разбиение по объемам может рассматриваться, как разбиение по волатильности. В результате статистическое распределение набора наблюдений ближе к нормальному и менее гетероскедастично, чем при разделении на равные временные интервалы. Таким образом, применение объемного пакетирования является простой альтернативой использованию моделей GARCH.
Для проверки робастности нашего вычисления VPIN мы продемонтрируем применение этой метрики для двух наиболее активно торгуемых фьючерсных контрактов : E-mini SnP500 (торгуемый на СМЕ) и фьючерс на сырую нефть WTI (торгуемый на NYMEX). Выборка взята на интервале с 1 января 2008 года по 6 июня 2011 года, сшитая по точкам наибольшего объема в дни экспираций. Размер пакета возьмем равным 1/50 от среднего дневного объема нашей выборки (V). Параметры вычисляются в скользящем окне размером n=50 ( что эквивалентно одному среднему дню по объему).
SnP500
На графике в заглавии поста показан ценовой график фьючерса E-mini SnP500 и его метрики VPIN. Метрика токсичности в основном стабильна, хотя и демонстрирует значительную волатильность. Отметим, что VPIN достигает наивысшего уровня в выборке 6 мая 2010 года, когда на бирже произошел большой обвал котировок. Такой высокий уровень VPIN согласован с потоком ордеров, который был большей частью односторонним в это время. Такая исключительная токсичность приводит к тому, что некоторые маркет мейкеры вынуждены потреблять ликвидность, вместо того, чтобы предоставлять ее и в итоге прекращают свои операции на рынке.
Более поздний эпизод экстремальной токсичности случился после японского землетрясения. Хотя землетрясение и цунами произошло ранним утром 11 марта 2011 года, больщих ценовых движений не было до аварии на Фукусиме 14 марта 2011 года. В этот день на SnP500 зарегистрирован еще один экстремальный уровень токсичности потока ордеров. В отличие от 6 мая 2010 года, обвал произошел на слабых объемах, в ночную сессию. После сделок всего лишь на 287 360 контрактов, индекс потерял около 2,5% его цены. На графике ниже видно, что кумулятивная функция распределения VPIN (CDF) была на уровне 0,97 в 3 часа дня, демонстрируя, что токсичность потока также может иметь место в моменты сниженной активности торгов.
Фьючерс на сырую нефть WTI
Нефть является наиболее активно торгующимся сырьевым активом, и ее стратегическая роль в мировой экономике делает ее идеальным инструментом для макроэкономических ставок. Энергетические фьючерсы также являются активом, где маркет мейкеры сталкиваются с экстремально большой волатильностью потока ордеров. Как показано на графике ниже, наивысшая токсичность потока наблюдалась также 6 мая 2010 года. Такое поведение согласуется с тем фактом, что в связи с тем, что обвал 6 мая не был связан с энергетическими активами, фьючерсы на нефть подверглись влиянию токсичности с других рынков. В следующий раз высокий уровень токсичности для этого контракта был достигнут 5 мая 2011 года.
В этот день была отмечена самая большая по объему длинная позиция в истории по сырьевым инструментам. Некоторые трейдеры решили зафиксировать прибыль именно 5 мая. Для выхода из своих больших позиций им пришлось искать ликвидность, но маркет мейкеры заметили давление продавцов и стали уходить с рынка, что привело к увеличению концентрации потока токсичности в общем объеме торгов. На графике ниже показано, что в 9:53 утра кумулятивная функция распределения VPIN пересекла уровень 0,9 и осталась там до конца дня. В течение этого периода WTI потерял около 8 %.
Токсичность потока и предсказание будущей цены
На высокочасстотном рынке маркет мейкеры могут использовать VPIN для измерения токсичности потока ордеров. Так как токсичность влияет на их прибыль, она должна также влиять и на поведение маркет мейкеров. В этом разделе мы установим связь между токсичностью и будущим движением цены.
Маркет мейкеру необходимо знать, как токсичность влияет на поведение цены, пока он удерживает открытую позицию. Маркет мейкеры ищут возможность перевернуть свои позиции много раз за день, но как часто они смогут это сделать, зависит от объема сделок. Таким образом, два вопроса актуальны для провайдера ликвидности. Первый - как высокая токсичность влияет на поведение цены в период удержания позиции? И второй - как длительность состояния высокой токсичности влияет на цену?
Чтобы ответить на эти вопросы, нужно исследовать взаимосвязи между токсичностью, ликвидностью и волатильностью.Сначала рассмотрим отношения между токсичностью и движением цены в последовательных объемных пакетах. Затем сравним, как длительность токсичности влияет на приращение цены на протяженных интервалах. В общем, мы знаем, что при увеличении токсичности маркет мейкеры сталкиваются с повышенными рисками и могут сократить свое присутствие на рынке или вовсе его покинуть. Это снижение ликвидности, в свою очередь, свидетельствует, что высокие значения VPIN ведут к большей изменчивости цены.
Поверхность корелляции
Начнем с простого вопроса: коррелирована ли метрика VPIN с будущим движением цены? Для измерения этого отношения используем корелляцию Пирсона между натуральным логарифмом VPIN и абсолютным приращением цены в следующем пакете:
, где - индекс объемного пакета.
Так как VPIN может определяться с применением различных комбинаций числа пакетов за один день и длины выборки, мы исследуем как эти оценочные параметры влияют на взаимоотношение метрики VPIN и будущего приращения цены.
Для фьючерса SnP500 VPIN положительно кореллирован с будущей волатильностью цены. Это отношение изображено на графике ниже, где каждая точка вычислена с использованием больших выборок - более 44 000 наблюдений. График показывает, что корелляция между VPIN и следующим абсолютным приращением цены плавно изменяется с разными величинами параметров. В общем, увеличение длины выборки приводит к увеличению корелляции, также как и увеличение числа пакетов за день.
Комбинация (50,250) похоже разумный выбор для этого контракта, и он имеет простую интерпретацию, как "данные за одну неделю" (50 объемных пакетов в день и 5 торговых дней). Для этой комбинации находим корелляцию на 44537 наблюдениях. Рассмотренный график показывает небольшое преимущество при этих параметрах, и существует широкий спектр комбинаций с похожей предсказательной силой.
Данный рисунок представляет собой график приращений цены фьючерса E-mini SnP500 в следующем пакете объема (1/50 среднего объема дня, используя комбинацию (50,250)), отсортированных по предыдущему уровню VPIN. График расширяется по вертикали при росте VPIN, иллюстрируя тот факт, что чем выше уровень токсичности, тем больше абсолютные приращения цены.
Данные выводы в терминах корелляции показательны, но простая корелляция это грубый критерий для зависимости. VPIN демонстрирует значительную серийную корелляцию, которая делает эти выводы спорными. Другой альтернативой может быть создание временной модели совместного процесса VPIN и приращений цены. Но наш подход заключается в группировании выборок по объемам, что затрудняет применение такой модели. Мы создадим безмодельный фреймворк для нахождения зависимостей, основанный на условных вероятностях. Для этого зададим два фундаментальных вопроса: 1) Когда VPIN высок, каково поведение последующих приращений цены? 2) Когда приращения цены велики, каков предыдущий уровень VPIN?
Условные вероятности
Для получения условных вероятностей, упомянутых нами в конце части 3, нужно вычислить совместное распределение VPIN и абсолютных приращений. Для этого сгруппируем VPINы c 5% шагом и абсолютные приращения в отрезки по 0,25%, чтобы отобразить дискретные распределения. Затем получим совместное распределение . Из этого совместного распределения выведем два распредения условной вероятности.
Сначала рассмотрим распределение абсолютных приращений в следущем пакете объема при условии нахождения VPIN в каждом из наших двадцати 5% отрезков (перцентилей). Результаты в виде 20 условных распределений, одно на каждый 5%-й отрезок, показаны в таблице ниже. Каждая строка в таблице представляет условное распределение абсолютных приращений, при условии предыдущего уровня VPIN.
Отметим три важных результата. Первое, когда VPIN низкий, последующие приращения также небольшие. В частности, когда VPIN в нижней четверти распределения, абсолютные приращения находятся в области от 0% до 0,25% в течение 90% времени. Второе, когда VPIN высок, условное распределение приращений имеет много больший разброс. В частности, большие абсолютные приращения (более 1,5%) иногда возникают в следующем объемном пакете, в отличие от случая, когда VPIN очень низок. Третье, даже для высоких уровней VPIN, абсолютные приращения в следующем пакете чаще небольшие. Мы вернемся к разбору этой ситуации ниже, где увидим, что высокие уровни VPIN должны держаться определенный период, для генерации больших приращений цены.
В последующей таблице мы исследуем распределение VPIN в пакете при условии абсолютных приращений между пакетом и . Каждый столбец таблицы представляет распределение предыдущего VPIN при условии нахождения абсолютных приращений в каждом отрезке по 0,25%. Важный результат здесь, это то, что когда приращения большие , предыдущий VPIN редко бывает низким. В частности, верхняя четверть этого распределения содержит более 84% всех приращений более 0,75%. Этот факт предполагает, что VPIN имеет некоторую страховую величину против экстремальных значений ценовой волатильности. Для вычисления этих условных вероятностей мы используем нашу стандартную (50,250) комбинацию. Этот выбор параметров максимизирует корелляцию между VPIN и абсолютными приращениями, но необязательно максимизирует "сценарий риска" , например, . Рисунок в заглавии поста показывает эффект выбора параметров страховой величины VPIN против абсолютных приращений более 0,75%.
График показывает, что пока число пакетов в день не является экстремально большим и длина выборки не слишком мала, вероятность, что VPIN был в верхней четверти распределения на один пакет ранее перед более чем 0,75% абсолютным приращением, будет от 80 до 90%. Этот результат означает, что VPIN предугадывает большие пропорции случаев экстремальной волатильности, а также, что индуцированная токсичностью волатильность является значительным источником общей волатильности.
Всегда ли экстремальные уровни волатильности возникают при высоком VPIN?
Из таблиц выше мы видим, что большие приращения не обязательно возникают в следующем пакете, если VPIN высок. По факту, большинство абсолютных приращений, следующих за высоким уровнем VPIN, имеют небольшую величину. Это наблюдение, тем не менее, согласуется с нашим предположением, что длительные высокие уровни VPIN ведут к волатильности цены. Для исследования этого утверждения, нам нужно рассчитать макимальную величину волатильности, которую должен установить маркет-мейкер, когда VPIN достигнет некоего критического уровня и останется на нем, или пойдет выше. Обвал рынка в 2008 году является яркой иллюстрацией, почему различие между мгновенной волатильностью и последующим уровнем волатильности так важно. В момент обвала VPIN оставался высоким перед падением цен и после его конца, а затем цены начали частичное восстановление. Если мы сфокусируемся на периоде начала падения, когда VPIN достиг высокого уровня до момента, когда он начал снижаться, то увидим, что за этот период падение цены было небольшим. Этот факт неприятен для маркет мейкеров, которые покинули рынок в момент обвала. Они были подвержены влиянию мгновенной волатильности , которая произошла, когда VPIN имел высокий уровень.
Чтобы исследовать максимальную мгновенную волатильность, воздействующую на маркет мейкера, когда VPIN пред этим был большим, мы вычислим волатильность при нахождении VPIN в каждом из 5% интервалов. Каждый раз, когда VPIN переходит от одного 5% интервала к другому, мы вычисляем наибольшее абсолютное приращение между мгновенными двумя (не обязательно соседними) пакетами, пока VPIN переходит в следующий 5% интервал. Например, представьте, что VPIN переходит от 85% через 4 пакета до 90 %. Мы вычисляем абсолютное приращение между пакетами 1 и 2, 1 и 3, 1 и 4, также как и между 2 и 3, 2 и 4 и 3 и 4. Нас интересует максимальное приращение из этих, которое мы рассматриваем как максимальную волатильность, с которой сталкивается маркет мейкер. Мы делаем это для каждого перехода VPIN.
Для точности, обозначим i индекс, который обновляется каждый раз, как VPIN переходит из одного интервала в другой, и - пакет, ассоциированный с индексом i. Это означает, что VPIN остается в том же интервале для пакетов , в нашем примере это был период из 4 пакетов, в котором VPIN оставался в 85 перцентиле. Наибольшее абсолютное приращение между двумя любыми пакетами, пока VPIN остается в указанном интервале обозначим:
В нашем примере выше это приращение является максимумом из шести приращений внутри интервала, где VPIN остается в 85 перцентиле.
Этот анализ более емкий, чем условные вероятности, показанные в первой таблице, по двум соображениям. Первое, мы не сравниваем абсолютные приращения, которые появляются немедленно за переходом VPIN из одного перецентиля в другой, а берем максимальное приращение, пока VPIN находится в одном интервале. Это согласуется с микроструктурной теорией, что волатильность возникает когда токсичность достигает порога, который превышает "терпимость" маркет мейкера. Второе, анализ считает ценовую волатильность по всем последовательностям внутренних пакетов, что позволяет учесть эффект дрифта цены , так же, как и восстановление цены к прежним уровням. Это важно, потому что медленные дрифты цены и ее восстановление могут скрывать экстремальную волатильность. Но этот анализ также ограничен в том, что он не учитывает продолжительные периоды роста токсичности, охватывающие множество перцентилей VPIN. В частности, мы не видим, что происходит, когда токсичность увеличивается сначала с 75% до 80%, а затем до 85% и 90% и т.д. Таким образом, эта проблема приводит к недооценке эффекта волатильности, индуцированной токсичностью.
На графике выше изображены вероятности наибольшего абсолютного приращения более 0,75%, пока VPIN остается в любом из 5% интервалов в верхней четверти распределения (то есть в интервалах 0,75-0,8; 0,8-0,85; 0,85-0,9; 0,9-0,95; 0,95-1,0) для различных комбинаций числа пакетов в день и длины выборки. Для нашей стандартной комбинации (50,250) мы нашли, что 51,84% времени VPIN входит в 5% интервал верхней четверти распределения , где хотя бы одно внутренне приращение превосходит 0,75% перед тем. как VPIN покинет этот интервал. Комбинация параметров, которая максимизирует предсказательную способность VPIN равна (10,350), то есть 10 пакетов в день при длине выборки 350 (около 1,6 месяца).
Заключение
В данном цикле статей мы показали, что VPIN имеет значительную предсказательную способность для индуцированной токсичностью волатильности и предоставляет некую "страховку" маркет мейкеру относительно будущих высоких приращений цены актива. Это свойство делает VPIN средством риск-менеджмента в мире высокочастотной торговли. Предоставление ликвидности это сложный процесс, и уровни токсичности влияют на масштаб и области активности маркет мейкеров. Высокие уровни VPIN сигнализируют о высоком риске большого последующего движения цены, исходя из эффекта воздействия токсичности на предоставление ликвидности. Этот связанный с ликвидностью риск очень важен для маркет мейкеров, прямо подверженных эффектам токсичности, но и для других трейдеров, кто сталкивается с большими движениями цен, возникающими из-за этих эффектов. Создание алгоритмов, которые варьируют свои паттерны исполнения в зависимости от уровня токсичности, поможет избежать трейдерам воздействия подобных рисков.
Не является индивидуальной инвестиционной рекомендацией | При копировании ссылка обязательна | Нашли ошибку - выделить и нажать Ctrl+Enter | Жалоба