Функциональный анализ
Теорема Хана-Банаха
Теорема Хана-Банаха говорит: любой ограниченный линейный функционал на подпространстве можно продолжить на всё пространство без потери нормы. Следствие геометрической формы: два непересекающихся выпуклых множества всегда можно разделить гиперплоскостью. За опорными векторами SVM стоит именно это. За no-arbitrage pricing в деривативах - тоже. За минимаксной теоремой фон Неймана - тоже. Одна теорема 1927-1929 годов пронизывает весь современный ML и финансовую математику. Приятный побочный эффект: из той же аксиомы выбора следует, что шар можно разбить на два шара того же размера.
- **SVM:** геометрическая форма Хана-Банаха гарантирует существование разделяющей гиперплоскости; двойственная задача SVM - прямое следствие теоремы о двойственности
- **No-arbitrage в финансах:** первая фундаментальная теорема финансовой математики доказывается через Хана-Банаха на пространстве платежей; Black-Scholes - следствие
- **Минимаксная теорема фон Неймана:** доказывается через разделение выпуклых множеств; основа всей теории игр с нулевой суммой
- **KKT и выпуклая оптимизация:** условия оптимальности Куна-Таккера и сильная двойственность в LP/QP следуют из разделения выпуклых конусов
- **Двойственные пространства в ML:** пространство L^inf* содержит L^1; dual pairing - механизм, аналогичный вниманию (query/key как пара функционал-вектор)
Продолжение функционалов
**1927-1929. Хан в Вене, Банах в Лемберге.** Оба независимо доказывают одно и то же: ограниченный линейный функционал на подпространстве можно продолжить на всё пространство - без увеличения нормы. Формально: пусть X - вещественное нормированное пространство, Y подпространство, f: Y -> R ограниченный линейный функционал. Тогда существует F: X -> R с F|_Y = f и ||F|| = ||f||.
**Идея доказательства - расширение по одному вектору.** Добавляем x_0 не из Y, строим Y_1 = span(Y, x_0). Значение c = F(x_0) выбирается так, чтобы |F(y + t*x_0)| <= ||f|| * ||y + t*x_0|| для всех y и t. Это ровно одно числовое ограничение: c должно попасть в пересечение интервалов по всем y из Y. Шаг повторяется трансфинитно. Лемма Цорна - эквивалент аксиомы выбора - гарантирует существование максимального продолжения.
**Аксиома выбора - не техническая мелочь.** Теорема Хана-Банаха эквивалентна утверждению, недоказуемому в ZF без аксиомы выбора. В конструктивной математике (Lean4 без AC) она не работает. Это практическое ограничение: верифицированный код, который должен обходиться без AC, не может использовать этот результат напрямую.
Почему в бесконечномерном случае теорема Хана-Банаха требует леммы Цорна?
Разделяющая гиперплоскость
Геометрическая форма Хана-Банаха - не следствие, а эквивалентная перефразировка. Если A и B - непересекающиеся выпуклые множества в нормированном пространстве, и A открытое, то существует функционал f из X* и c из R такие, что f(a) < c <= f(b) для всех a из A, b из B. Функционал f задаёт разделяющую гиперплоскость.
**Тонкость бесконечномерного случая:** два замкнутых выпуклых непересекающихся множества могут иметь расстояние 0 и не разделяться гиперплоскостью строго. Классический пример в C([0,1]): A = {f : f(0) = 0} и B = {f : ∫₀¹ f dt = 1} - замкнуты, выпуклы, не пересекаются, и разделяются гиперплоскостью, но не строго (d(A,B) = 0). Открытость одного или компактность обоих необходимы для строгого разделения.
**SVM - это буквально теорема о разделении в действии.** Два класса точек - два выпуклых множества (выпуклые оболочки). Геометрическая форма Хана-Банаха гарантирует существование разделяющей гиперплоскости при линейной разделимости. SVM ищет оптимальную из таких гиперплоскостей - с максимальным зазором. Сама максимизация зазора - это уже выпуклое программирование, но существование объекта поиска - теорема Хана-Банаха.
Почему для строгого разделения двух непересекающихся выпуклых множеств одной замкнутости недостаточно?
Двойственное пространство и рефлексивность
Следствие теоремы: сопряжённое пространство X* достаточно богато. Для любого x не равного нулю существует f из X* с f(x) не равным нулю. Норма восстанавливается через функционалы: ||x|| = sup{|f(x)| : f из X*, ||f|| <= 1}. Каноническое вложение J: X -> X** изометрично. Это означает: функционалы полностью описывают геометрию пространства.
**Рефлексивность:** X рефлексивно, если J: X -> X** - изоморфизм (сюръекция). Примеры рефлексивных: L^p при 1 < p < бесконечность, гильбертовы пространства. Нерефлексивны: L^1, L^inf, C[0,1]. Для рефлексивных пространств замкнутые ограниченные множества слабо компактны - теорема Алаоглу-Банаха. В ML: пространства функций потерь, которые используются в анализе сходимости обучения, должны быть рефлексивны, чтобы минимум достигался.
Что означает рефлексивность банахова пространства X?
Следствия: SVM, no-arbitrage, minimax
Три применения - три радикально разных домена, один математический стержень.
| Домен | Применение | Роль Хана-Банаха |
|---|---|---|
| ML | SVM - максимальный зазор | Геом. форма гарантирует существование разделяющей гиперплоскости |
| Финансы | No-arbitrage pricing | Первая теорема об арбитраже = Хана-Банаха на пространстве платежей |
| Теория игр | Минимаксная теорема фон Неймана | Доказывается через теорему о разделении |
| Парадокс | Банах-Тарский: шар -> два шара | Следствие аксиомы выбора, используемой в доказательстве |
**No-arbitrage и функциональный анализ:** Первая фундаментальная теорема финансовой математики - рынок без арбитража тогда и только тогда, когда существует эквивалентная мартингальная мера. Доказательство идёт через Хана-Банаха: пространство платежей, конус достижимых платежей, разделяющий функционал = ценовой оператор. Black-Scholes формула - следствие этой конструкции.
**Парадокс Банаха-Тарского:** Из теоремы Хана-Банаха (точнее, из аксиомы выбора, которую она использует) следует: шар в R^3 можно разбить на 5 частей и сложить в два шара того же радиуса. Это не нарушает физику - неизмеримые множества, которые получаются при разбиении, не имеют объёма. Но это делает теорему Хана-Банаха одновременно утилитарным инструментом ML и философским кошмаром математиков-конструктивистов.
Теорема Хана-Банаха - абстрактный результат без практических приложений
Хан-Банах - фундамент двойственности в оптимизации (KKT, SVM, Farkas), no-arbitrage в финансах и минимаксной теории игр
Разделение выпуклых множеств гиперплоскостью - это граница между допустимым и недопустимым в задачах с ограничениями. Каждое условие оптимальности - версия этого разделения
Как теорема Хана-Банаха связана с задачей SVM?
Ключевые идеи
- **Продолжение:** ограниченный линейный функционал на подпространстве продолжается на всё нормированное пространство без увеличения нормы; доказательство - лемма Цорна + аксиома выбора
- **Разделение:** два непересекающихся выпуклых множества (одно открытое) разделяются гиперплоскостью f(x) = c; в бесконечномерных пространствах нужна открытость или компактность
- **Двойственность:** ||x|| = sup{|f(x)| : ||f|| <= 1}; X* богато; рефлексивные пространства (L^p, 1 < p < inf) имеют X** изоморфно X
- **SVM + финансы + игры:** три домена, одна идея - разделяющая гиперплоскость между выпуклыми множествами
Связанные темы
Теорема Хана-Банаха - основа всего функционального анализа:
- Теорема об открытом отображении — Следующая большая теорема Банаха той же эпохи - ограниченные биективные операторы открыты
- Спектральная теория — Двойственность и рефлексивность - ключевые инструменты спектрального анализа операторов
Вопросы для размышления
- Теорема Хана-Банаха использует аксиому выбора. Существуют ли конструктивные доказательства для конкретных пространств - например, L^p[0,1] при рациональных p?
- Продолжение функционала по теореме Хана-Банаха не единственно. Когда оно единственно, и что это говорит о гладкости нормы пространства?
- Как теорема о разделении выпуклых множеств связана с алгоритмом Sinkhorn для оптимального транспорта - можно ли проследить геометрическую связь?
Связанные уроки
- fa-01 — Норма, банахово пространство - фундамент для формулировки
- fa-05 — Теорема об открытом отображении - следующая большая теорема
- top-04 — Метрическое пространство - язык сходимости, двойственный язык разделения
- mt-01 — Теория меры - основа для функционалов на L^p
- la-12-vector-spaces