Статистика

Калман-фильтр, ARCH/GARCH и коинтеграция

Финансовые рынки меняют не только уровень, но и скорость изменений. ARCH Энгла (1982) и GARCH Боллерслева (1986) формализуют это - волатильность сама нестационарна. Ракета не видит свою позицию - она оценивает через зашумлённые измерения. Продвинутые модели временных рядов описывают именно эту динамичную, неопределённую реальность.

  • GPS и авиация: фильтр Калмана оценивает позицию из зашумлённых сигналов акселерометра и GPS
  • Опционная торговля: GARCH предсказывает волатильность для ценообразования деривативов
  • Парная торговля (stat arb): коинтеграция определяет стационарный спред для mean-reversion стратегии

Предварительные знания

  • Causal Inference

State Space Models и фильтр Калмана

**State Space Model (SSM)** разделяет скрытое состояние xₜ и наблюдение yₜ: xₜ = Aₜxₜ₋₁ + Bₜuₜ + wₜ (уравнение состояния), yₜ = Cₜxₜ + Dₜuₜ + vₜ (уравнение наблюдения), где wₜ ~ N(0,Q), vₜ ~ N(0,R). **Фильтр Калмана** - оптимальный байесовский оценщик xₜ при линейности и гауссовских шумах. Предикция: x̂ₜ|ₜ₋₁ = Ax̂ₜ₋₁, Pₜ|ₜ₋₁ = APₜ₋₁Aᵀ + Q. Коррекция: Kₜ = Pₜ|ₜ₋₁Cᵀ(CPₜ|ₜ₋₁Cᵀ+R)⁻¹, x̂ₜ = x̂ₜ|ₜ₋₁ + Kₜ(yₜ − Cx̂ₜ|ₜ₋₁).

**Расширения фильтра Калмана:** Extended Kalman Filter (EKF) - линеаризует нелинейные системы через якобиан; Unscented KF (UKF) - использует sigma-points для лучшей аппроксимации; Particle Filter - Monte Carlo методы для произвольных нелинейных/негауссовских систем. SSM - основа структурных временных рядов (Prophet, Statsmodels structural_ts) и скрытых марковских моделей (HMM).

В фильтре Калмана усиление K = P·Cᵀ(C·P·Cᵀ + R)⁻¹. Что происходит при R → 0 (очень точные измерения)?

ARCH/GARCH: модели волатильности

**ARCH(q)** (Autoregressive Conditional Heteroskedasticity): σ²ₜ = α₀ + ∑ᵢ αᵢ ε²ₜ₋ᵢ - волатильность зависит от прошлых квадратов ошибок. **GARCH(p,q):** σ²ₜ = α₀ + ∑αᵢε²ₜ₋ᵢ + ∑βⱼσ²ₜ₋ⱼ - добавляет инерцию волатильности. GARCH(1,1) используется повсеместно в финансах: σ²ₜ = ω + αε²ₜ₋₁ + βσ²ₜ₋₁, где α+β < 1 для стационарности. Unconditional variance: σ² = ω/(1−α−β).

**Расширения GARCH:** EGARCH учитывает асимметрию (leverage effect: плохие новости повышают волатильность больше, чем хорошие). GJR-GARCH: σ²ₜ = ω + (α+γ·Iₜ₋₁)ε²ₜ₋₁ + βσ²ₜ₋₁, Iₜ₋₁=1 при εₜ₋₁<0. GARCH-M: риск-премия - ожидаемая доходность зависит от текущей волатильности. DCC-GARCH (Dynamic Conditional Correlation): многомерная волатильность для портфелей.

GARCH(1,1): α=0.12, β=0.85. Безусловная (долгосрочная) волатильность: σ = √(ω/(1−α−β)) = 1.5%. Сегодня был резкий рост: σ²_t=25 (σ=5%). Какова ожидаемая волатильность завтра σ²_{t+1}?

Единичный корень и коинтеграция

**Единичный корень:** ряд yₜ = φyₜ₋₁ + εₜ нестационарен при φ=1 (случайное блуждание). **Тест Дикки-Фуллера:** H₀: φ=1 (единичный корень). Статистика τ = (φ̂−1)/SE(φ̂) имеет нестандартное распределение. Порядок интегрированности I(d): ряд нужно d раз продифференцировать для стационарности. **Коинтеграция:** нестационарные ряды X_t~I(1) и Y_t~I(1) коинтегрированы, если ∃β: Yₜ − βXₜ ~ I(0). Это долгосрочное равновесие. Тест Йохансена определяет число коинтегрирующих векторов.

**Spurious regression:** регрессия двух независимых случайных блужданий даёт высокое R² и значимый t-тест - это артефакт нестационарности! Стандартное правило: если оба ряда I(1) и коинтеграция не подтверждена, не интерпретируй коэффициенты регрессии. Первое дифференцирование устраняет единичный корень, но теряет долгосрочные зависимости. Правильный путь - ECM (Error Correction Model) после подтверждения коинтеграции.

Регрессия Y_t на X_t дала R²=0.87, p<0.001. Оба ряда I(1), тест Энгла-Грэнджера на остатках дал τ=−1.5 (критическое −3.4). Каков правильный вывод?

Ключевые идеи

  • SSM: xₜ=Axₜ₋₁+wₜ, yₜ=Cxₜ+vₜ; фильтр Калмана - оптимальная линейная оценка xₜ
  • GARCH(1,1): σ²ₜ=ω+αε²ₜ₋₁+βσ²ₜ₋₁; безусловная σ²=ω/(1−α−β)
  • ADF тест: H₀: единичный корень; τ < критич. → I(0)
  • Коинтеграция: Yₜ−βXₜ~I(0) при Xₜ,Yₜ~I(1) → долгосрочное равновесие
  • Spurious regression: нестационарные ряды без коинтеграции дают ложные R² и p-values

Временные ряды и курс

State Space Models - обобщение многих временных рядов: ARIMA, структурные модели, DLM. GARCH связан с conditional heteroskedasticity и тяжёлыми хвостами. Коинтеграция применяет теорию интегрированности к многомерным системам.

  • Вариационный байесовский вывод — Байесовские SSM используют вариационный вывод для оценки параметров при нелинейных переходах
  • Графические модели — SSM - частный случай HMM, который есть направленная графическая модель

Вопросы для размышления

  • В фильтре Калмана усиление Kₜ называют «коэффициентом доверия наблюдению». При каких условиях (соотношение Q и R) фильтр больше доверяет наблюдениям, а при каких - модели? Как это соотносится с ridge regression?
  • Почему кластеризация волатильности (большие изменения цен кластеризуются) нарушает предположение о i.i.d. остатках в обычных временных рядах? Какие последствия это имеет для Value at Risk?
  • Концепция коинтеграции позволяет торговать «спредом» между двумя нестационарными активами. Как изменится стратегия парной торговли, если параметр коинтеграции β нестабилен во времени?

Связанные уроки

  • prob-17
Калман-фильтр, ARCH/GARCH и коинтеграция

0

1

Войти