Дифференциальная геометрия
Theorema Egregium Гаусса
Сферу нельзя развернуть на плоскость без разрывов или складок. Цилиндр - можно. В чём разница? Гауссова кривизна: у сферы K=1/R2, у цилиндра K=0. Theorema Egregium 1827 года: K измеряется изнутри поверхности, без выхода во внешнее пространство. 194 года спустя - Facebook Poincare embeddings, Riemannian SGD, geometric deep learning. Всё это работает с многообразиями ненулевой кривизны. Гаусс сам называл этот результат 'достойным восхищения'. Эйнштейн строил на нём ОТО. Bronstein строит на нём geometric DL.
- **Poincare embeddings (Facebook 2017):** гиперболическое пространство K=-1 для WordNet - 5 измерений вместо 200+ евклидовых при лучшем качестве
- **Geometric deep learning (Bronstein 2021):** CNN как частный случай работы на плоском K=0 многообразии; сферические CNN и гиперболические сети - обобщения
- **Картография:** все проекции карт искажают расстояния, углы или площади - Theorema Egregium делает идеальную карту математически невозможной
- **3D-меши:** дискретная Гаусс-Бонне через угловые дефекты - быстрое определение топологии 3D-модели
Предварительные знания
Теорема: K - внутренний инвариант
**1827 год. Гаусс публикует Disquisitiones generales circa superficies curvas и сам называет один результат 'theorema egregium' - теоремой, достойной восхищения.** Через 88 лет Эйнштейн строит на этой теореме общую теорию относительности. Через 194 года Facebook использует её геометрию для Poincare embeddings.
Суть теоремы можно сформулировать в одной строке: **гауссова кривизна K вычисляется только через первую квадратичную форму E, F, G - без нормали, без информации о вложении в R3.** Это значит: K - внутреннее свойство поверхности, которое жук-геодез, ползущий по ней, может измерить изнутри, не выходя в окружающее пространство.
**Следствие: изометрия сохраняет K.** Нельзя согнуть поверхность без растяжения и изменить K. Лист бумаги (K=0) при любом гнутии остаётся с K=0. Сфера (K=1/R2) не изометрична плоскости. Цилиндр, конус и плоскость изометричны: у всех K=0.
| Поверхность | K | Изометрична |
|---|---|---|
| Плоскость | 0 | Цилиндру, конусу |
| Цилиндр R | 0 | Плоскости, конусу |
| Конус | 0 | Плоскости, цилиндру |
| Сфера R | 1/R2 | Только другой сфере R |
| Псевдосфера | -1/R2 | Плоскости Лобачевского (K=-1) |
**H - не внутренний инвариант.** Плоскость H=0, цилиндр H=1/(2R) - но они изометричны. Жук на цилиндре не может обнаружить H внутренними измерениями. Именно поэтому нельзя путать K и H в геометрическом DL: K - интринсивная характеристика многообразия данных, H зависит от вложения.
Почему нельзя нарисовать идеальную карту Земли без искажений?
Изометрии и картографические проекции
**Изометрия** - отображение f: S1 -> S2, сохраняющее метрику (первую квадратичную форму). Коэффициенты E, F, G совпадают в соответствующих параметризациях. Изометрия сохраняет длины кривых, углы и площади.
Картографические проекции - это попытка найти хоть какое-то отображение сфера -> плоскость с минимальными искажениями. Их несколько классов, и каждый жертвует чем-то своим: **Меркатор** сохраняет углы (конформная), но искажает площади (Гренландия = Африка визуально). **Гуд** сохраняет площади, но рвёт форму. **Азимутальная** точна у центра, врёт у краёв. Все - следствие теоремы.
**ML-приложение - manifold hypothesis:** данные (изображения, тексты) лежат на многообразии меньшей размерности. Если это многообразие имеет K != 0, его нельзя изометрично 'выпрямить' в евклидово пространство - информация о расстояниях теряется. Именно поэтому Nickel & Kiela (Facebook, 2017) предложили Poincare embeddings: гиперболическое пространство (K=-1) для иерархических данных вместо плоского R^n.
Конус (без вершины) изометрично разворачивается на плоскость. Что НЕ сохраняется?
Теорема Гаусса-Бонне: кривизна = топология
**Глобальная теорема Гаусса-Бонне:** для замкнутой ориентируемой поверхности M: **integral integral_M K dA = 2pi * chi(M)**, где chi(M) = V - E + F - эйлерова характеристика. Суммарная кривизна зависит только от топологии - форма не важна совсем.
Сфера (chi=2): суммарная кривизна = 4pi, независимо от размера. Тор (chi=0): суммарная кривизна = 0 - положительные и отрицательные области точно компенсируют друг друга. Претцель с тремя дырками (chi=-4): суммарная кривизна = -8pi. Это не совпадение - это теорема.
**Дискретная версия для 3D-мешей:** угловой дефицит delta_i = 2pi - sum(углы граней у вершины i). Тогда sum_i delta_i = 2pi*chi. Один проход по вершинам - и топология меша известна без какой-либо детальной геометрии. Используется в mesh processing, 3D-печати, анализе CAD-моделей.
**Geometric deep learning (Bronstein 2021):** обобщение CNN на многообразия и графы - частный случай работы на поверхностях с заданной K. Обычный CNN - это работа на плоском (K=0) многообразии R^2. На сфере (K>0) или гиперболоиде (K<0) нужна другая архитектура свёртки. Гаусс-Бонне объясняет, почему нельзя просто скопировать евклидову архитектуру.
Замкнутая поверхность имеет integral integral K dA = -8pi. Каков её род g?
Кривизна в ML: от Poincare до Riemannian SGD
**Poincare embeddings (Nickel & Kiela, Facebook AI, 2017)** - первое масштабное применение гиперболической геометрии (K=-1) в ML. Идея: иерархические данные (WordNet: 82,115 слов, 743,241 отношений) естественно живут в гиперболическом пространстве - дерево вписывается в диск Пуанкаре без exponential distortion. В евклидовом R^n для этого нужна размерность 200+, в гиперболическом - хватает 5 измерений.
**Riemannian SGD (RSGD)** - обобщение градиентного спуска на многообразия с кривизной K != 0. Обычный SGD делает шаг в касательном пространстве и проецирует обратно на многообразие. Для гиперболического пространства это непросто: геодезики изогнуты, exp map и log map - не тождества. Реализации: geoopt (PyTorch), McTorch.
**Ricci flow** - эволюция метрики по уравнению dg/dt = -2*Ric (Ric - тензор Риччи, след тензора Римана). Использован Перельманом в 2003 для доказательства гипотезы Пуанкаре (Millennium Prize). В ML: Ricci curvature как характеристика графов - Ollivier-Ricci curvature для детекции community structure и network bottlenecks (Lin & Lu & Yau, 2011).
Почему Poincare embeddings эффективнее евклидовых для иерархических данных?
Ключевые идеи
- **Theorema Egregium:** K вычисляется только через E, F, G. Изометрия сохраняет K. Сфера (K>0) и плоскость (K=0) не изометричны - отсюда невозможность идеальных карт
- **Изометрия** сохраняет первую форму - длины, углы, площади. H при этом не сохраняется
- **Теорема Гаусса-Бонне:** integral K dA = 2pi*chi(M). Суммарная кривизна = топологический инвариант
- **Poincare embeddings и RSGD:** K=-1 гиперболического пространства позволяет вложить иерархии экспоненциально эффективнее R^n
Связанные темы
Theorema Egregium - мост между кривизной, метрикой и топологией:
- Гауссова кривизна — K = kappa1*kappa2 определяется внешне в dg-04, здесь выясняется её внутренняя природа
- Тензор кривизны Римана — Полный внутренний тензор кривизны - обобщение K на многообразия
- Теорема Гаусса-Бонне (полная) — Обобщение, Чёрн-классы, топологические инсуляторы
Вопросы для размышления
- На торе integral integral K dA = 0, хотя K меняет знак. Можно ли построить тор с K=0 везде? Плоский тор вкладывается изометрично в R4, но не в R3.
- Poincare disk использует евклидову метрику в R2, но расстояние другое. Является ли диск Пуанкаре изометричным евклидовой плоскости? Почему?
- Loss landscape нейросети - многообразие в пространстве параметров. Какой смысл имеет 'кривизна' этого многообразия? Является ли она внутренней или внешней характеристикой?
Связанные уроки
- dg-04 — K = kappa1*kappa2 через вторую форму - фундамент для Theorema Egregium
- dg-10 — Тензор Римана - полное обобщение K на многообразия произвольной размерности
- dg-11 — Теорема Гаусса-Бонне во всей силе: Чёрн-классы, топологические инсуляторы
- ig-02-fisher-metric — Fisher information metric - кривизна на многообразии вероятностных распределений
- ig-07-natural-gradient — Natural gradient - Riemannian SGD на многообразии параметров модели
- de-03 — Геодезические уравнения - ОДУ на многообразии с ненулевой кривизной
- calc-01-sequences