Функциональный анализ

Теорема Хана-Банаха

Теорема Хана-Банаха говорит: любой ограниченный линейный функционал на подпространстве можно продолжить на всё пространство без потери нормы. Следствие геометрической формы: два непересекающихся выпуклых множества всегда можно разделить гиперплоскостью. За опорными векторами SVM стоит именно это. За no-arbitrage pricing в деривативах - тоже. За минимаксной теоремой фон Неймана - тоже. Одна теорема 1927-1929 годов пронизывает весь современный ML и финансовую математику. Приятный побочный эффект: из той же аксиомы выбора следует, что шар можно разбить на два шара того же размера.

  • **SVM:** геометрическая форма Хана-Банаха гарантирует существование разделяющей гиперплоскости; двойственная задача SVM - прямое следствие теоремы о двойственности
  • **No-arbitrage в финансах:** первая фундаментальная теорема финансовой математики доказывается через Хана-Банаха на пространстве платежей; Black-Scholes - следствие
  • **Минимаксная теорема фон Неймана:** доказывается через разделение выпуклых множеств; основа всей теории игр с нулевой суммой
  • **KKT и выпуклая оптимизация:** условия оптимальности Куна-Таккера и сильная двойственность в LP/QP следуют из разделения выпуклых конусов
  • **Двойственные пространства в ML:** пространство L^inf* содержит L^1; dual pairing - механизм, аналогичный вниманию (query/key как пара функционал-вектор)

Продолжение функционалов

**1927-1929. Хан в Вене, Банах в Лемберге.** Оба независимо доказывают одно и то же: ограниченный линейный функционал на подпространстве можно продолжить на всё пространство - без увеличения нормы. Формально: пусть X - вещественное нормированное пространство, Y подпространство, f: Y -> R ограниченный линейный функционал. Тогда существует F: X -> R с F|_Y = f и ||F|| = ||f||.

**Идея доказательства - расширение по одному вектору.** Добавляем x_0 не из Y, строим Y_1 = span(Y, x_0). Значение c = F(x_0) выбирается так, чтобы |F(y + t*x_0)| <= ||f|| * ||y + t*x_0|| для всех y и t. Это ровно одно числовое ограничение: c должно попасть в пересечение интервалов по всем y из Y. Шаг повторяется трансфинитно. Лемма Цорна - эквивалент аксиомы выбора - гарантирует существование максимального продолжения.

**Аксиома выбора - не техническая мелочь.** Теорема Хана-Банаха эквивалентна утверждению, недоказуемому в ZF без аксиомы выбора. В конструктивной математике (Lean4 без AC) она не работает. Это практическое ограничение: верифицированный код, который должен обходиться без AC, не может использовать этот результат напрямую.

Почему в бесконечномерном случае теорема Хана-Банаха требует леммы Цорна?

Разделяющая гиперплоскость

Геометрическая форма Хана-Банаха - не следствие, а эквивалентная перефразировка. Если A и B - непересекающиеся выпуклые множества в нормированном пространстве, и A открытое, то существует функционал f из X* и c из R такие, что f(a) < c <= f(b) для всех a из A, b из B. Функционал f задаёт разделяющую гиперплоскость.

**Тонкость бесконечномерного случая:** два замкнутых выпуклых непересекающихся множества могут иметь расстояние 0 и не разделяться гиперплоскостью строго. Классический пример в C([0,1]): A = {f : f(0) = 0} и B = {f : ∫₀¹ f dt = 1} - замкнуты, выпуклы, не пересекаются, и разделяются гиперплоскостью, но не строго (d(A,B) = 0). Открытость одного или компактность обоих необходимы для строгого разделения.

**SVM - это буквально теорема о разделении в действии.** Два класса точек - два выпуклых множества (выпуклые оболочки). Геометрическая форма Хана-Банаха гарантирует существование разделяющей гиперплоскости при линейной разделимости. SVM ищет оптимальную из таких гиперплоскостей - с максимальным зазором. Сама максимизация зазора - это уже выпуклое программирование, но существование объекта поиска - теорема Хана-Банаха.

Почему для строгого разделения двух непересекающихся выпуклых множеств одной замкнутости недостаточно?

Двойственное пространство и рефлексивность

Следствие теоремы: сопряжённое пространство X* достаточно богато. Для любого x не равного нулю существует f из X* с f(x) не равным нулю. Норма восстанавливается через функционалы: ||x|| = sup{|f(x)| : f из X*, ||f|| <= 1}. Каноническое вложение J: X -> X** изометрично. Это означает: функционалы полностью описывают геометрию пространства.

**Рефлексивность:** X рефлексивно, если J: X -> X** - изоморфизм (сюръекция). Примеры рефлексивных: L^p при 1 < p < бесконечность, гильбертовы пространства. Нерефлексивны: L^1, L^inf, C[0,1]. Для рефлексивных пространств замкнутые ограниченные множества слабо компактны - теорема Алаоглу-Банаха. В ML: пространства функций потерь, которые используются в анализе сходимости обучения, должны быть рефлексивны, чтобы минимум достигался.

Что означает рефлексивность банахова пространства X?

Следствия: SVM, no-arbitrage, minimax

Три применения - три радикально разных домена, один математический стержень.

ДоменПрименениеРоль Хана-Банаха
MLSVM - максимальный зазорГеом. форма гарантирует существование разделяющей гиперплоскости
ФинансыNo-arbitrage pricingПервая теорема об арбитраже = Хана-Банаха на пространстве платежей
Теория игрМинимаксная теорема фон НейманаДоказывается через теорему о разделении
ПарадоксБанах-Тарский: шар -> два шараСледствие аксиомы выбора, используемой в доказательстве

**No-arbitrage и функциональный анализ:** Первая фундаментальная теорема финансовой математики - рынок без арбитража тогда и только тогда, когда существует эквивалентная мартингальная мера. Доказательство идёт через Хана-Банаха: пространство платежей, конус достижимых платежей, разделяющий функционал = ценовой оператор. Black-Scholes формула - следствие этой конструкции.

**Парадокс Банаха-Тарского:** Из теоремы Хана-Банаха (точнее, из аксиомы выбора, которую она использует) следует: шар в R^3 можно разбить на 5 частей и сложить в два шара того же радиуса. Это не нарушает физику - неизмеримые множества, которые получаются при разбиении, не имеют объёма. Но это делает теорему Хана-Банаха одновременно утилитарным инструментом ML и философским кошмаром математиков-конструктивистов.

Теорема Хана-Банаха - абстрактный результат без практических приложений

Хан-Банах - фундамент двойственности в оптимизации (KKT, SVM, Farkas), no-arbitrage в финансах и минимаксной теории игр

Разделение выпуклых множеств гиперплоскостью - это граница между допустимым и недопустимым в задачах с ограничениями. Каждое условие оптимальности - версия этого разделения

Как теорема Хана-Банаха связана с задачей SVM?

Ключевые идеи

  • **Продолжение:** ограниченный линейный функционал на подпространстве продолжается на всё нормированное пространство без увеличения нормы; доказательство - лемма Цорна + аксиома выбора
  • **Разделение:** два непересекающихся выпуклых множества (одно открытое) разделяются гиперплоскостью f(x) = c; в бесконечномерных пространствах нужна открытость или компактность
  • **Двойственность:** ||x|| = sup{|f(x)| : ||f|| <= 1}; X* богато; рефлексивные пространства (L^p, 1 < p < inf) имеют X** изоморфно X
  • **SVM + финансы + игры:** три домена, одна идея - разделяющая гиперплоскость между выпуклыми множествами

Связанные темы

Теорема Хана-Банаха - основа всего функционального анализа:

  • Теорема об открытом отображении — Следующая большая теорема Банаха той же эпохи - ограниченные биективные операторы открыты
  • Спектральная теория — Двойственность и рефлексивность - ключевые инструменты спектрального анализа операторов

Вопросы для размышления

  • Теорема Хана-Банаха использует аксиому выбора. Существуют ли конструктивные доказательства для конкретных пространств - например, L^p[0,1] при рациональных p?
  • Продолжение функционала по теореме Хана-Банаха не единственно. Когда оно единственно, и что это говорит о гладкости нормы пространства?
  • Как теорема о разделении выпуклых множеств связана с алгоритмом Sinkhorn для оптимального транспорта - можно ли проследить геометрическую связь?

Связанные уроки

  • fa-01 — Норма, банахово пространство - фундамент для формулировки
  • fa-05 — Теорема об открытом отображении - следующая большая теорема
  • top-04 — Метрическое пространство - язык сходимости, двойственный язык разделения
  • mt-01 — Теория меры - основа для функционалов на L^p
  • la-12-vector-spaces
Теорема Хана-Банаха

0

1

Войти