Теория вероятностей

Теория больших уклонений

Цели урока

  • Понять принцип больших уклонений как точную экспоненциальную оценку редких событий
  • Освоить функцию скоростей Крамера через преобразование Лежандра-Фенхеля
  • Разобрать принцип Сановса и связь с KL-дивергенцией
  • Применить теорему Донскера-Варадана к марковским цепям

Предварительные знания

  • Производящие функции моментов и их свойства
  • Выпуклые функции и преобразование Лежандра
  • KL-дивергенция и информационная геометрия
  • Центральная предельная теорема и закон больших чисел
  • Случайные матрицы

Страховая компания хочет вероятность убытков в 5 раз выше среднего. ЦПТ отвечает 'почти ноль' - бесполезно. Теория больших уклонений даёт точное P ~ exp(-n*I(x)).

  • **Страхование:** резервы Allianz рассчитываются через функцию скоростей Крамера для хвостовых потерь 10^(-9)
  • **Теория кодирования:** теорема Шеннона использует принцип Сановса - скорость ошибок декодирования задана KL-дивергенцией
  • **Reinforcement learning:** концентрация Q-функции в Q-learning контролируется Донскером-Варданом; PPO применяет KL-ограничения, мотивированные Сановсом
  • **Финансы:** оценка хвостового VaR для портфеля недоступна гауссовым методам - нужна крамеровская асимптотика

Теорема Крамера и функция скоростей

Страховщик Allianz держит резервы на случай, когда убытки превышают ожидаемые в 5 раз - событие с вероятностью 10^(-9). ЦПТ отвечает 'почти ноль' - бесполезно. Харальд Крамер в 1938 году решил эту задачу точно: P(X_n_bar >= x) ~ exp(-n·I(x)), где I - функция скоростей, вычисляемая через преобразование Лежандра.

Для нормального распределения I(x) = (x-mu)^2/(2*sigma^2) - крамеровская оценка совпадает с гауссовыми хвостами. В общем случае I асимметрична: P(X_n_bar - E[X] > epsilon) и P(X_n_bar - E[X] < -epsilon) могут падать с разными скоростями.

Функция скоростей Крамера I(x) является сопряжённой по Лежандру к какой функции?

Принцип Сановса для эмпирических мер

Иван Сановс в 1957 году совершил скачок от скалярных средних к распределениям: какова вероятность того, что эмпирическая мера mu_n_hat по выборке размера n окажется ближе к ню, а не к истинному mu? Ответ - KL-дивергенция в показателе. Это связало теорию больших уклонений с шенноновской теорией информации и обосновало теоремы кодирования.

Принцип Сановса доказывает второй закон термодинамики на вероятностном языке: макросостояние максимальной энтропии - I-проекция равномерного распределения на множество ограничений; отклонения от него экспоненциально маловероятны с показателем = энтропийный дефицит.

Какова функция скоростей в принципе Сановса для эмпирической меры?

Теорема Донскера-Варадана для марковских цепей

Моника Донскер и Шриниваса Варадан в 1975-1983 годах построили принцип больших уклонений для марковских цепей и стохастических процессов - работа, принесшая Варадану премию Абеля в 2007 году. В современном RL это лежит в основе оценки concentration в Q-learning: вероятность того, что эмпирическое распределение состояний цепи отклонится от стационарного, контролируется функционалом Донскера-Варадана.

Большие уклонения соединяют вероятность и информацию

Принцип больших уклонений - мост между вероятностью, теорией информации и статистической физикой.

  • Теория информации — Принцип Сановса: функция скоростей для эмпирических мер - KL-дивергенция D(nu||mu); основа теорем кодирования Шеннона
  • Статистическая механика — Принцип Больцмана S = -k*log P(макросостояние) - частный случай принципа больших уклонений
  • Reinforcement learning — Концентрация Q-функции в RL контролируется Донскером-Варданом; PPO/TRPO используют KL-ограничения, мотивированные Сановсом
  • Стохастические процессы — Донскер-Варадан переносит принцип больших уклонений на марковские цепи, диффузии и эмпирические занятости

Итоги

  • **Теорема Крамера:** P(X_n_bar >= x) ~ exp(-n*I(x)), I = Лежандр-сопряжённая к log-MGF
  • **Принцип Сановса:** P(mu_n_hat ~ nu) ~ exp(-n*D_KL(nu||mu)) - функция скоростей = KL-дивергенция
  • **Контракционный принцип:** Крамер выводится из Сановса проекцией на условие E_nu[X] = x
  • **Гертнер-Эллис:** обобщение Крамера на зависимые величины через предельную log-MGF
  • **Донскер-Варадан:** большие уклонения для марковских цепей; функционал I(nu) учитывает оператор переходов P
  • **Связь с ЦПТ:** ЦПТ даёт гауссово приближение на 1/sqrt(n); LDP - точную экспоненциальную асимптотику

Что отличает функционал Донскера-Варадана от KL-дивергенции в принципе Сановса?

Теория больших уклонений

0

1

Войти