Статистика
Калман-фильтр, ARCH/GARCH и коинтеграция
Финансовые рынки меняют не только уровень, но и скорость изменений. ARCH Энгла (1982) и GARCH Боллерслева (1986) формализуют это - волатильность сама нестационарна. Ракета не видит свою позицию - она оценивает через зашумлённые измерения. Продвинутые модели временных рядов описывают именно эту динамичную, неопределённую реальность.
- GPS и авиация: фильтр Калмана оценивает позицию из зашумлённых сигналов акселерометра и GPS
- Опционная торговля: GARCH предсказывает волатильность для ценообразования деривативов
- Парная торговля (stat arb): коинтеграция определяет стационарный спред для mean-reversion стратегии
Предварительные знания
State Space Models и фильтр Калмана
**State Space Model (SSM)** разделяет скрытое состояние xₜ и наблюдение yₜ: xₜ = Aₜxₜ₋₁ + Bₜuₜ + wₜ (уравнение состояния), yₜ = Cₜxₜ + Dₜuₜ + vₜ (уравнение наблюдения), где wₜ ~ N(0,Q), vₜ ~ N(0,R). **Фильтр Калмана** - оптимальный байесовский оценщик xₜ при линейности и гауссовских шумах. Предикция: x̂ₜ|ₜ₋₁ = Ax̂ₜ₋₁, Pₜ|ₜ₋₁ = APₜ₋₁Aᵀ + Q. Коррекция: Kₜ = Pₜ|ₜ₋₁Cᵀ(CPₜ|ₜ₋₁Cᵀ+R)⁻¹, x̂ₜ = x̂ₜ|ₜ₋₁ + Kₜ(yₜ − Cx̂ₜ|ₜ₋₁).
**Расширения фильтра Калмана:** Extended Kalman Filter (EKF) - линеаризует нелинейные системы через якобиан; Unscented KF (UKF) - использует sigma-points для лучшей аппроксимации; Particle Filter - Monte Carlo методы для произвольных нелинейных/негауссовских систем. SSM - основа структурных временных рядов (Prophet, Statsmodels structural_ts) и скрытых марковских моделей (HMM).
В фильтре Калмана усиление K = P·Cᵀ(C·P·Cᵀ + R)⁻¹. Что происходит при R → 0 (очень точные измерения)?
ARCH/GARCH: модели волатильности
**ARCH(q)** (Autoregressive Conditional Heteroskedasticity): σ²ₜ = α₀ + ∑ᵢ αᵢ ε²ₜ₋ᵢ - волатильность зависит от прошлых квадратов ошибок. **GARCH(p,q):** σ²ₜ = α₀ + ∑αᵢε²ₜ₋ᵢ + ∑βⱼσ²ₜ₋ⱼ - добавляет инерцию волатильности. GARCH(1,1) используется повсеместно в финансах: σ²ₜ = ω + αε²ₜ₋₁ + βσ²ₜ₋₁, где α+β < 1 для стационарности. Unconditional variance: σ² = ω/(1−α−β).
**Расширения GARCH:** EGARCH учитывает асимметрию (leverage effect: плохие новости повышают волатильность больше, чем хорошие). GJR-GARCH: σ²ₜ = ω + (α+γ·Iₜ₋₁)ε²ₜ₋₁ + βσ²ₜ₋₁, Iₜ₋₁=1 при εₜ₋₁<0. GARCH-M: риск-премия - ожидаемая доходность зависит от текущей волатильности. DCC-GARCH (Dynamic Conditional Correlation): многомерная волатильность для портфелей.
GARCH(1,1): α=0.12, β=0.85. Безусловная (долгосрочная) волатильность: σ = √(ω/(1−α−β)) = 1.5%. Сегодня был резкий рост: σ²_t=25 (σ=5%). Какова ожидаемая волатильность завтра σ²_{t+1}?
Единичный корень и коинтеграция
**Единичный корень:** ряд yₜ = φyₜ₋₁ + εₜ нестационарен при φ=1 (случайное блуждание). **Тест Дикки-Фуллера:** H₀: φ=1 (единичный корень). Статистика τ = (φ̂−1)/SE(φ̂) имеет нестандартное распределение. Порядок интегрированности I(d): ряд нужно d раз продифференцировать для стационарности. **Коинтеграция:** нестационарные ряды X_t~I(1) и Y_t~I(1) коинтегрированы, если ∃β: Yₜ − βXₜ ~ I(0). Это долгосрочное равновесие. Тест Йохансена определяет число коинтегрирующих векторов.
**Spurious regression:** регрессия двух независимых случайных блужданий даёт высокое R² и значимый t-тест - это артефакт нестационарности! Стандартное правило: если оба ряда I(1) и коинтеграция не подтверждена, не интерпретируй коэффициенты регрессии. Первое дифференцирование устраняет единичный корень, но теряет долгосрочные зависимости. Правильный путь - ECM (Error Correction Model) после подтверждения коинтеграции.
Регрессия Y_t на X_t дала R²=0.87, p<0.001. Оба ряда I(1), тест Энгла-Грэнджера на остатках дал τ=−1.5 (критическое −3.4). Каков правильный вывод?
Ключевые идеи
- SSM: xₜ=Axₜ₋₁+wₜ, yₜ=Cxₜ+vₜ; фильтр Калмана - оптимальная линейная оценка xₜ
- GARCH(1,1): σ²ₜ=ω+αε²ₜ₋₁+βσ²ₜ₋₁; безусловная σ²=ω/(1−α−β)
- ADF тест: H₀: единичный корень; τ < критич. → I(0)
- Коинтеграция: Yₜ−βXₜ~I(0) при Xₜ,Yₜ~I(1) → долгосрочное равновесие
- Spurious regression: нестационарные ряды без коинтеграции дают ложные R² и p-values
Временные ряды и курс
State Space Models - обобщение многих временных рядов: ARIMA, структурные модели, DLM. GARCH связан с conditional heteroskedasticity и тяжёлыми хвостами. Коинтеграция применяет теорию интегрированности к многомерным системам.
- Вариационный байесовский вывод — Байесовские SSM используют вариационный вывод для оценки параметров при нелинейных переходах
- Графические модели — SSM - частный случай HMM, который есть направленная графическая модель
Вопросы для размышления
- В фильтре Калмана усиление Kₜ называют «коэффициентом доверия наблюдению». При каких условиях (соотношение Q и R) фильтр больше доверяет наблюдениям, а при каких - модели? Как это соотносится с ridge regression?
- Почему кластеризация волатильности (большие изменения цен кластеризуются) нарушает предположение о i.i.d. остатках в обычных временных рядах? Какие последствия это имеет для Value at Risk?
- Концепция коинтеграции позволяет торговать «спредом» между двумя нестационарными активами. Как изменится стратегия парной торговли, если параметр коинтеграции β нестабилен во времени?