Случайные процессы
Случайные процессы: определения
Stable Diffusion рисует одно изображение за 1000 шагов. Каждый шаг - случайный процесс Ланжевена: $x_{t-1} = \frac{1}{\sqrt{\alpha_t}}(x_t - \frac{1-\alpha_t}{\sqrt{1-\bar{\alpha}_t}} \epsilon_\theta) + \sigma_t z$. Тысяча итераций стохастического процесса - и из чистого шума появляется лицо. Это не магия. Это обратная цепь Маркова.
- **Диффузионные модели (DDPM):** DALL-E 3, Stable Diffusion, Midjourney - всё это обратные стохастические процессы; прямой процесс зашумляет за 1000 шагов Маркова, обратный - восстанавливает
- **Reinforcement Learning:** среда в RL формально - марковский процесс принятия решений (MDP); $\mathbb{P}(s_{t+1} | s_t, a_t)$ - переходное ядро стохастического процесса
- **Байесовский вывод:** MCMC (Metropolis-Hastings, NUTS) - это стохастические процессы, стационарное распределение которых есть искомый posterior; эргодичность гарантирует сходимость
Стохастический процесс
Курс акции меняется каждую секунду. Температура колеблется каждую минуту. Число пакетов в сети скачет каждую миллисекунду. Все это - случайные процессы. **Стохастический процесс** {X(t), t in T} - это семейство случайных величин, индексированных параметром t (обычно временем).
Формально: случайный процесс - это функция двух аргументов X(t, omega), где t - время, omega - элемент вероятностного пространства. При фиксированном omega получаем одну конкретную траекторию (реализацию). При фиксированном t получаем случайную величину.
Процессы бывают **с дискретным временем** (цепи Маркова, случайное блуждание - t = 0, 1, 2, ...) и **с непрерывным временем** (Броуновское движение, пуассоновский процесс - t принадлежит R+). Пространство значений тоже может быть дискретным или непрерывным.
| Тип процесса | Время | Значения | Пример |
|---|---|---|---|
| Цепь Маркова | Дискретное | Дискретные | Погода (солнце/дождь) |
| Случайное блуждание | Дискретное | Непрерывные | Цена акции (дискретные дни) |
| Пуассоновский процесс | Непрерывное | Дискретные | Число звонков в call-центр |
| Броуновское движение | Непрерывное | Непрерывные | Движение частицы в жидкости |
Что мы получим, зафиксировав время t=t₀ в случайном процессе X(t, omega)?
Реализация (траектория)
Одна конкретная «развёртка» случайного процесса называется **реализацией** или **траекторией**. Если процесс - это весь ансамбль возможных историй, то реализация - одна конкретная история, которую мы наблюдаем.
Курс Bitcoin за вчерашний день - это одна реализация. Сегодняшний курс - другая реализация того же процесса. На практике мы обычно наблюдаем одну-единственную реализацию и пытаемся по ней судить о свойствах всего процесса.
**Ансамбль** - множество всех возможных реализаций процесса. Статистику можно считать двумя способами: **по ансамблю** (фиксируем t, усредняем по omega) или **по времени** (фиксируем omega, усредняем по t). Ключевой вопрос: совпадают ли эти два вида усреднения?
На практике у нас часто есть только одна реализация (один пациент, один рынок, одна планета). Это делает вопрос эргодичности критически важным: можем ли мы по одной долгой реализации судить о статистических свойствах всего процесса?
У нас есть данные температуры за один год (одна реализация). Что мы можем оценить без допущения эргодичности?
Стационарность
Процесс **стационарный**, если его статистические свойства не меняются при сдвиге во времени. Температура в полдень 1 января и температура в полдень 1 июля имеют разные распределения - процесс нестационарен. Но шум в электронной цепи может быть стационарным: его статистика одинакова утром и вечером.
**Строгая стационарность:** все конечномерные распределения инвариантны относительно сдвига: P(X(t₁),...,X(tₙ)) = P(X(t₁+τ),...,X(tₙ+τ)) для любого τ. **Стационарность в широком смысле (WSS):** E[X(t)] = const, Cov(X(t), X(t+τ)) зависит только от τ.
Стационарность - критически важное допущение для анализа временных рядов. Многие методы (автокорреляция, спектральный анализ) работают только для стационарных процессов. Нестационарный ряд часто приводят к стационарному через дифференцирование или удаление тренда.
| Процесс | Стационарный? | Почему |
|---|---|---|
| Белый шум | Да (строго) | i.i.d., все моменты постоянны |
| AR(1) с |φ|<1 | Да (WSS) | Среднее и ковариация не зависят от t |
| Случайное блуждание | Нет | Дисперсия растёт линейно с t |
| Сезонный ряд продаж | Нет | Среднее периодически меняется |
Случайное блуждание X(t) = X(t-1) + epsilon(t) нестационарно, потому что:
Эргодичность
Стационарность говорит, что статистика не меняется во времени. **Эргодичность** идёт дальше: среднее по времени одной бесконечно длинной реализации равно среднему по ансамблю всех возможных реализаций. Это позволяет изучать процесс, имея всего одну траекторию.
**Теорема Биркгофа:** Для стационарного эргодического процесса: lim(T→∞) (1/T) * integral(0, T, X(t)dt) = E[X(t)] почти наверняка. Среднее по времени сходится к среднему по ансамблю.
Не каждый стационарный процесс эргодичен. Рассмотрим пример: бросаем монету один раз, и если орёл - X(t) = +1 для всех t, решка - X(t) = -1 для всех t. Процесс стационарный (распределение не зависит от t), но среднее по времени = +1 или -1, а среднее по ансамблю = 0.
Ludwig Boltzmann и эргодическая гипотеза
Термин «эргодический» ввёл Ludwig Boltzmann в 1870-х годах для описания поведения молекул газа. Его гипотеза: газ за достаточное время проходит через все допустимые состояния. Строгое доказательство (эргодическая теорема) дали Birkhoff и von Neumann в 1930-х.
Практическое значение эргодичности огромно. Если процесс эргодический - достаточно одного длинного наблюдения для оценки всех статистических свойств. Если нет - нужно множество независимых реализаций, что часто невозможно (у нас одна экономика, один климат, один пациент).
Стационарный процесс = постоянный (не меняется во времени)
Стационарный процесс колеблется и может принимать разные значения, но его статистические свойства (среднее, дисперсия, корреляция) не зависят от момента наблюдения
Белый шум - идеальный стационарный процесс, при этом он непрерывно меняется. Стационарность - свойство статистики, а не отдельных реализаций. В контексте ML: диффузионный процесс зашумления нестационарен (дисперсия растёт), но обратный процесс специально сконструирован так, чтобы стационарным распределением была целевая плотность данных
Процесс: один раз генерируем mu из N(0,1), затем X(t) = mu + epsilon(t) с epsilon ~ N(0,0.01). Этот процесс:
Ключевые идеи
- **Стохастический процесс** $\{X(t)\}$ - семейство случайных величин, параметризованных временем; фиксация $\omega$ даёт реализацию, фиксация $t$ - случайную величину
- **Реализация** - одна траектория; 1000 шагов DDPM - одна реализация обратного стохастического процесса, одна сгенерированная картинка
- **Стационарность** - статистика не зависит от момента наблюдения; белый шум стационарен, случайное блуждание - нет ($\text{Var}(X(t)) = t\sigma^2$ растёт)
- **Эргодичность** - среднее по времени = среднее по ансамблю; MCMC работает именно потому, что сконструированная цепь Маркова эргодична с нужным стационарным распределением
Связанные темы
Случайные процессы - основа для цепей Маркова и далее:
- Цепи Маркова с дискретным временем — Важнейший класс случайных процессов с марковским свойством
- Цепи Маркова с непрерывным временем — Расширение на непрерывное время - модели очередей, химических реакций
Вопросы для размышления
- Процесс сердцебиения - стационарный? Эргодический? Как это проверить статистически?
- Почему для прогнозирования погоды нельзя просто усреднить температуру за 10 лет и предсказать завтрашнюю?
- MCMC сэмплирует из posterior, используя эргодичность. Что случится с алгоритмом, если цепь Маркова окажется неэргодической?