Случайные процессы

Случайные процессы: определения

Stable Diffusion рисует одно изображение за 1000 шагов. Каждый шаг - случайный процесс Ланжевена: $x_{t-1} = \frac{1}{\sqrt{\alpha_t}}(x_t - \frac{1-\alpha_t}{\sqrt{1-\bar{\alpha}_t}} \epsilon_\theta) + \sigma_t z$. Тысяча итераций стохастического процесса - и из чистого шума появляется лицо. Это не магия. Это обратная цепь Маркова.

**Диффузионные модели (DDPM):** DALL-E 3, Stable Diffusion, Midjourney - всё это обратные стохастические процессы; прямой процесс зашумляет за 1000 шагов Маркова, обратный - восстанавливает
**Reinforcement Learning:** среда в RL формально - марковский процесс принятия решений (MDP); $\mathbb{P}(s_{t+1} | s_t, a_t)$ - переходное ядро стохастического процесса
**Байесовский вывод:** MCMC (Metropolis-Hastings, NUTS) - это стохастические процессы, стационарное распределение которых есть искомый posterior; эргодичность гарантирует сходимость

Стохастический процесс

Курс акции меняется каждую секунду. Температура колеблется каждую минуту. Число пакетов в сети скачет каждую миллисекунду. Все это - случайные процессы. **Стохастический процесс** {X(t), t in T} - это семейство случайных величин, индексированных параметром t (обычно временем).

Формально: случайный процесс - это функция двух аргументов X(t, omega), где t - время, omega - элемент вероятностного пространства. При фиксированном omega получаем одну конкретную траекторию (реализацию). При фиксированном t получаем случайную величину.

Процессы бывают **с дискретным временем** (цепи Маркова, случайное блуждание - t = 0, 1, 2, ...) и **с непрерывным временем** (Броуновское движение, пуассоновский процесс - t принадлежит R+). Пространство значений тоже может быть дискретным или непрерывным.

Тип процесса	Время	Значения	Пример
Цепь Маркова	Дискретное	Дискретные	Погода (солнце/дождь)
Случайное блуждание	Дискретное	Непрерывные	Цена акции (дискретные дни)
Пуассоновский процесс	Непрерывное	Дискретные	Число звонков в call-центр
Броуновское движение	Непрерывное	Непрерывные	Движение частицы в жидкости

Что мы получим, зафиксировав время t=t₀ в случайном процессе X(t, omega)?

Реализация (траектория)

Одна конкретная «развёртка» случайного процесса называется **реализацией** или **траекторией**. Если процесс - это весь ансамбль возможных историй, то реализация - одна конкретная история, которую мы наблюдаем.

Курс Bitcoin за вчерашний день - это одна реализация. Сегодняшний курс - другая реализация того же процесса. На практике мы обычно наблюдаем одну-единственную реализацию и пытаемся по ней судить о свойствах всего процесса.

**Ансамбль** - множество всех возможных реализаций процесса. Статистику можно считать двумя способами: **по ансамблю** (фиксируем t, усредняем по omega) или **по времени** (фиксируем omega, усредняем по t). Ключевой вопрос: совпадают ли эти два вида усреднения?

На практике у нас часто есть только одна реализация (один пациент, один рынок, одна планета). Это делает вопрос эргодичности критически важным: можем ли мы по одной долгой реализации судить о статистических свойствах всего процесса?

У нас есть данные температуры за один год (одна реализация). Что мы можем оценить без допущения эргодичности?

Стационарность

Процесс **стационарный**, если его статистические свойства не меняются при сдвиге во времени. Температура в полдень 1 января и температура в полдень 1 июля имеют разные распределения - процесс нестационарен. Но шум в электронной цепи может быть стационарным: его статистика одинакова утром и вечером.

**Строгая стационарность:** все конечномерные распределения инвариантны относительно сдвига: P(X(t₁),...,X(tₙ)) = P(X(t₁+τ),...,X(tₙ+τ)) для любого τ. **Стационарность в широком смысле (WSS):** E[X(t)] = const, Cov(X(t), X(t+τ)) зависит только от τ.

Стационарность - критически важное допущение для анализа временных рядов. Многие методы (автокорреляция, спектральный анализ) работают только для стационарных процессов. Нестационарный ряд часто приводят к стационарному через дифференцирование или удаление тренда.

Процесс	Стационарный?	Почему
Белый шум	Да (строго)	i.i.d., все моменты постоянны
AR(1) с \|φ\|<1	Да (WSS)	Среднее и ковариация не зависят от t
Случайное блуждание	Нет	Дисперсия растёт линейно с t
Сезонный ряд продаж	Нет	Среднее периодически меняется

Случайное блуждание X(t) = X(t-1) + epsilon(t) нестационарно, потому что:

Эргодичность

Стационарность говорит, что статистика не меняется во времени. **Эргодичность** идёт дальше: среднее по времени одной бесконечно длинной реализации равно среднему по ансамблю всех возможных реализаций. Это позволяет изучать процесс, имея всего одну траекторию.

**Теорема Биркгофа:** Для стационарного эргодического процесса: lim(T→∞) (1/T) * integral(0, T, X(t)dt) = E[X(t)] почти наверняка. Среднее по времени сходится к среднему по ансамблю.

Не каждый стационарный процесс эргодичен. Рассмотрим пример: бросаем монету один раз, и если орёл - X(t) = +1 для всех t, решка - X(t) = -1 для всех t. Процесс стационарный (распределение не зависит от t), но среднее по времени = +1 или -1, а среднее по ансамблю = 0.

Ludwig Boltzmann и эргодическая гипотеза

Термин «эргодический» ввёл Ludwig Boltzmann в 1870-х годах для описания поведения молекул газа. Его гипотеза: газ за достаточное время проходит через все допустимые состояния. Строгое доказательство (эргодическая теорема) дали Birkhoff и von Neumann в 1930-х.

Практическое значение эргодичности огромно. Если процесс эргодический - достаточно одного длинного наблюдения для оценки всех статистических свойств. Если нет - нужно множество независимых реализаций, что часто невозможно (у нас одна экономика, один климат, один пациент).

Стационарный процесс = постоянный (не меняется во времени)

Стационарный процесс колеблется и может принимать разные значения, но его статистические свойства (среднее, дисперсия, корреляция) не зависят от момента наблюдения

Белый шум - идеальный стационарный процесс, при этом он непрерывно меняется. Стационарность - свойство статистики, а не отдельных реализаций. В контексте ML: диффузионный процесс зашумления нестационарен (дисперсия растёт), но обратный процесс специально сконструирован так, чтобы стационарным распределением была целевая плотность данных

Процесс: один раз генерируем mu из N(0,1), затем X(t) = mu + epsilon(t) с epsilon ~ N(0,0.01). Этот процесс:

Ключевые идеи

**Стохастический процесс** $\{X(t)\}$ - семейство случайных величин, параметризованных временем; фиксация $\omega$ даёт реализацию, фиксация $t$ - случайную величину
**Реализация** - одна траектория; 1000 шагов DDPM - одна реализация обратного стохастического процесса, одна сгенерированная картинка
**Стационарность** - статистика не зависит от момента наблюдения; белый шум стационарен, случайное блуждание - нет ($\text{Var}(X(t)) = t\sigma^2$ растёт)
**Эргодичность** - среднее по времени = среднее по ансамблю; MCMC работает именно потому, что сконструированная цепь Маркова эргодична с нужным стационарным распределением

Связанные темы

Случайные процессы - основа для цепей Маркова и далее:

Цепи Маркова с дискретным временем — Важнейший класс случайных процессов с марковским свойством
Цепи Маркова с непрерывным временем — Расширение на непрерывное время - модели очередей, химических реакций

Вопросы для размышления

Процесс сердцебиения - стационарный? Эргодический? Как это проверить статистически?
Почему для прогнозирования погоды нельзя просто усреднить температуру за 10 лет и предсказать завтрашнюю?
MCMC сэмплирует из posterior, используя эргодичность. Что случится с алгоритмом, если цепь Маркова окажется неэргодической?

Связанные уроки

prob-06-random-vars