Теория меры
Абстрактная теория интегрирования
Интеграл Римана не может проинтегрировать индикаторную функцию рациональных чисел $\mathbf{1}_{\mathbb{Q}}$ - она разрывна всюду. Интеграл Лебега даёт ответ немедленно: $\int \mathbf{1}_{\mathbb{Q}} \, d\mu = \mu(\mathbb{Q} \cap [0,1]) = 0$. Это не технический трюк, а фундаментальное расширение, без которого современный вероятностный анализ и теория сигналов были бы невозможны.
- Теория $L^p$ пространств: функции из $L^2$ образуют гильбертово пространство - фундамент квантовой механики, обработки сигналов и нейросетей с весовыми нормами.
- Теорема о мажорированной сходимости (DCT) - рабочая лошадка машинного обучения: оправдывает дифференцирование под знаком интеграла при вычислении градиентов ожидания в REINFORCE и других policy gradient алгоритмах.
- Неравенство Гёльдера $\|fg\|_1 \leq \|f\|_p \|g\|_q$ лежит в основе доказательств bounds в статистическом обучении и информационной теории.
Цели урока
- Конструировать интеграл Лебега через простые функции и объяснять его преимущества перед интегралом Римана
- Применять теорему о мажорированной сходимости для обмена предела и интеграла
- Доказывать неравенство Гёльдера и использовать его для анализа $L^p$ пространств
Предварительные знания
- Теория меры: сигма-алгебры и меры
- Измеримые функции и их свойства
- Интеграл Римана и его ограничения
Конструкция интеграла Лебега
Интеграл строится в три этапа. Шаг 1: для простой функции $\phi = \sum_{k=1}^n c_k \mathbf{1}_{A_k}$ (измеримые $A_k$, $c_k \geq 0$) определяем $\int \phi \, d\mu = \sum c_k \mu(A_k)$ (с соглашением $0 \cdot \infty = 0$). Шаг 2: для неотрицательной измеримой $f$ - супремум по простым $\phi \leq f$. Шаг 3: общий случай $f = f^+ - f^-$, где $f^+ = \max(f,0)$, $f^- = \max(-f,0)$.
Три ключевые теоремы сходимости: (1) Монотонная сходимость (MCT): $0 \leq f_n \nearrow f$ a.e. $\Rightarrow$ $\int f_n \to \int f$. (2) Лемма Фату: $\int \liminf f_n \leq \liminf \int f_n$. (3) Мажорированная сходимость (DCT): $f_n \to f$ a.e., $|f_n| \leq g \in L^1$ $\Rightarrow$ $\int f_n \to \int f$. DCT - самая мощная: требует интегрируемой мажоранты.
Пространства $L^p$ и неравенство Гёльдера
Для $p \geq 1$ пространство $L^p(\mu) = \{f : \|f\|_p = (\int |f|^p \, d\mu)^{1/p} < \infty\}$. При $p=2$ - гильбертово пространство со скалярным произведением $\langle f, g \rangle = \int fg \, d\mu$. Неравенство Гёльдера: $\int |fg| \, d\mu \leq \|f\|_p \|g\|_q$ при $1/p + 1/q = 1$. При $p=q=2$ - неравенство Коши-Буняковского. Доказательство через неравенство Янга: $ab \leq a^p/p + b^q/q$.
Элементы $L^p$ - это классы эквивалентности функций, совпадающих почти всюду, а не отдельные функции. Изменение функции на множестве меры нуля не меняет её $L^p$ норму. Это технически важно: вопрос 'значение $f$ в точке $x$' не имеет смысла для элемента $L^p$ без дополнительных условий регулярности.
Анри Лебег опубликовал свой интеграл в 1902 году в возрасте 27 лет в диссертации
Анри Лебег опубликовал свой интеграл в 1902 году в возрасте 27 лет в диссертации «Интеграл, длина, площадь». Одновременно Эмиль Борель разрабатывал теорию меры. Полемика между Лебегом и Борелем о приоритете длилась годами. Пространства $L^p$ систематизировал Рисс в 1910 году. Теоремы сходимости Лебега позволили строго обосновать разложения Фурье - главный инструмент инженеров того времени.
Интеграл Лебега и теоремы сходимости
Анри Лебег в 1902 году построил интеграл, охватывающий 1 700 000 функций из тех, что не интегрируемы по Риману на [0,1]. Современный анализ, теория вероятностей и квантовая механика неотделимы от этого понятия.
Почему теорема Лебега о доминированной сходимости требует мажоранты g ∈ L¹(μ)?
Пространства Lp и неравенство Гёльдера
Стефан Банах в 1932 году показал, что L²([0,1]) - полное гильбертово пространство с 2^(ℵ₀) элементами. Пространства Lp объединяют анализ, теорию вероятностей и функциональный анализ в единую архитектуру.
При каком условии L²([0,1]) ⊂ L¹([0,1])?
DCT в вычислении градиентов
В REINFORCE нужно $\nabla_\theta \mathbb{E}_{\pi_\theta}[R] = \mathbb{E}[R \nabla_\theta \log \pi_\theta]$. Формально это $\nabla_\theta \int R(\tau) \pi_\theta(\tau) \, d\tau = \int R(\tau) \nabla_\theta \pi_\theta(\tau) \, d\tau$. DCT оправдывает перенос $\nabla_\theta$ под интеграл: нужна мажоранта $|R(\tau) \nabla_\theta \log \pi_\theta| \leq g(\tau)$ с $\int g \, d\tau < \infty$ - что выполнено при ограниченных наградах.
Итоги
- Интеграл Лебега строится через простые функции и расширяет Риманов интеграл на все измеримые функции.
- DCT оправдывает перенос предела под интеграл при наличии интегрируемой мажоранты.
- Пространства $L^p$ - функциональные пространства с нормой; неравенство Гёльдера связывает $L^p$ и $L^q$ нормы сопряжённых пространств.
Связь с другими темами
В теории вероятностей интеграл Лебега - это математическое ожидание: $\mathbb{E}[X] = \int X \, dP$. Теорема Радона-Никодима (mt-28) расширяет эту связь: плотность вероятности - производная Радона-Никодима меры. В функциональном анализе двойственное к $L^p$ - это $L^q$, что следует из неравенства Гёльдера.
- Mt 28 — связан
Вопросы для размышления
- Функция Дирихле $\mathbf{1}_{\mathbb{Q}}$ не интегрируема по Риману, но $\int \mathbf{1}_{\mathbb{Q}} \, d\lambda = 0$ по Лебегу (рациональные числа образуют счётное, а значит, нулевое множество). Как этот пример иллюстрирует разницу между разбиением по $x$ (Риман) и разбиением по $y$ (Лебег)?