Дифференциальная геометрия

Theorema Egregium Гаусса

Сферу нельзя развернуть на плоскость без разрывов или складок. Цилиндр - можно. В чём разница? Гауссова кривизна: у сферы K=1/R2, у цилиндра K=0. Theorema Egregium 1827 года: K измеряется изнутри поверхности, без выхода во внешнее пространство. 194 года спустя - Facebook Poincare embeddings, Riemannian SGD, geometric deep learning. Всё это работает с многообразиями ненулевой кривизны. Гаусс сам называл этот результат 'достойным восхищения'. Эйнштейн строил на нём ОТО. Bronstein строит на нём geometric DL.

**Poincare embeddings (Facebook 2017):** гиперболическое пространство K=-1 для WordNet - 5 измерений вместо 200+ евклидовых при лучшем качестве
**Geometric deep learning (Bronstein 2021):** CNN как частный случай работы на плоском K=0 многообразии; сферические CNN и гиперболические сети - обобщения
**Картография:** все проекции карт искажают расстояния, углы или площади - Theorema Egregium делает идеальную карту математически невозможной
**3D-меши:** дискретная Гаусс-Бонне через угловые дефекты - быстрое определение топологии 3D-модели

Предварительные знания

Гауссова и средняя кривизна

Теорема: K - внутренний инвариант

**1827 год. Гаусс публикует Disquisitiones generales circa superficies curvas и сам называет один результат 'theorema egregium' - теоремой, достойной восхищения.** Через 88 лет Эйнштейн строит на этой теореме общую теорию относительности. Через 194 года Facebook использует её геометрию для Poincare embeddings.

Суть теоремы можно сформулировать в одной строке: **гауссова кривизна K вычисляется только через первую квадратичную форму E, F, G - без нормали, без информации о вложении в R3.** Это значит: K - внутреннее свойство поверхности, которое жук-геодез, ползущий по ней, может измерить изнутри, не выходя в окружающее пространство.

**Следствие: изометрия сохраняет K.** Нельзя согнуть поверхность без растяжения и изменить K. Лист бумаги (K=0) при любом гнутии остаётся с K=0. Сфера (K=1/R2) не изометрична плоскости. Цилиндр, конус и плоскость изометричны: у всех K=0.

Поверхность	K	Изометрична
Плоскость	0	Цилиндру, конусу
Цилиндр R	0	Плоскости, конусу
Конус	0	Плоскости, цилиндру
Сфера R	1/R2	Только другой сфере R
Псевдосфера	-1/R2	Плоскости Лобачевского (K=-1)

**H - не внутренний инвариант.** Плоскость H=0, цилиндр H=1/(2R) - но они изометричны. Жук на цилиндре не может обнаружить H внутренними измерениями. Именно поэтому нельзя путать K и H в геометрическом DL: K - интринсивная характеристика многообразия данных, H зависит от вложения.

Почему нельзя нарисовать идеальную карту Земли без искажений?

Изометрии и картографические проекции

**Изометрия** - отображение f: S1 -> S2, сохраняющее метрику (первую квадратичную форму). Коэффициенты E, F, G совпадают в соответствующих параметризациях. Изометрия сохраняет длины кривых, углы и площади.

Картографические проекции - это попытка найти хоть какое-то отображение сфера -> плоскость с минимальными искажениями. Их несколько классов, и каждый жертвует чем-то своим: **Меркатор** сохраняет углы (конформная), но искажает площади (Гренландия = Африка визуально). **Гуд** сохраняет площади, но рвёт форму. **Азимутальная** точна у центра, врёт у краёв. Все - следствие теоремы.

**ML-приложение - manifold hypothesis:** данные (изображения, тексты) лежат на многообразии меньшей размерности. Если это многообразие имеет K != 0, его нельзя изометрично 'выпрямить' в евклидово пространство - информация о расстояниях теряется. Именно поэтому Nickel & Kiela (Facebook, 2017) предложили Poincare embeddings: гиперболическое пространство (K=-1) для иерархических данных вместо плоского R^n.

Конус (без вершины) изометрично разворачивается на плоскость. Что НЕ сохраняется?

Теорема Гаусса-Бонне: кривизна = топология

**Глобальная теорема Гаусса-Бонне:** для замкнутой ориентируемой поверхности M: **integral integral_M K dA = 2pi * chi(M)**, где chi(M) = V - E + F - эйлерова характеристика. Суммарная кривизна зависит только от топологии - форма не важна совсем.

Сфера (chi=2): суммарная кривизна = 4pi, независимо от размера. Тор (chi=0): суммарная кривизна = 0 - положительные и отрицательные области точно компенсируют друг друга. Претцель с тремя дырками (chi=-4): суммарная кривизна = -8pi. Это не совпадение - это теорема.

**Дискретная версия для 3D-мешей:** угловой дефицит delta_i = 2pi - sum(углы граней у вершины i). Тогда sum_i delta_i = 2pi*chi. Один проход по вершинам - и топология меша известна без какой-либо детальной геометрии. Используется в mesh processing, 3D-печати, анализе CAD-моделей.

**Geometric deep learning (Bronstein 2021):** обобщение CNN на многообразия и графы - частный случай работы на поверхностях с заданной K. Обычный CNN - это работа на плоском (K=0) многообразии R^2. На сфере (K>0) или гиперболоиде (K<0) нужна другая архитектура свёртки. Гаусс-Бонне объясняет, почему нельзя просто скопировать евклидову архитектуру.

Замкнутая поверхность имеет integral integral K dA = -8pi. Каков её род g?

Кривизна в ML: от Poincare до Riemannian SGD

**Poincare embeddings (Nickel & Kiela, Facebook AI, 2017)** - первое масштабное применение гиперболической геометрии (K=-1) в ML. Идея: иерархические данные (WordNet: 82,115 слов, 743,241 отношений) естественно живут в гиперболическом пространстве - дерево вписывается в диск Пуанкаре без exponential distortion. В евклидовом R^n для этого нужна размерность 200+, в гиперболическом - хватает 5 измерений.

**Riemannian SGD (RSGD)** - обобщение градиентного спуска на многообразия с кривизной K != 0. Обычный SGD делает шаг в касательном пространстве и проецирует обратно на многообразие. Для гиперболического пространства это непросто: геодезики изогнуты, exp map и log map - не тождества. Реализации: geoopt (PyTorch), McTorch.

**Ricci flow** - эволюция метрики по уравнению dg/dt = -2*Ric (Ric - тензор Риччи, след тензора Римана). Использован Перельманом в 2003 для доказательства гипотезы Пуанкаре (Millennium Prize). В ML: Ricci curvature как характеристика графов - Ollivier-Ricci curvature для детекции community structure и network bottlenecks (Lin & Lu & Yau, 2011).

Почему Poincare embeddings эффективнее евклидовых для иерархических данных?

Ключевые идеи

**Theorema Egregium:** K вычисляется только через E, F, G. Изометрия сохраняет K. Сфера (K>0) и плоскость (K=0) не изометричны - отсюда невозможность идеальных карт
**Изометрия** сохраняет первую форму - длины, углы, площади. H при этом не сохраняется
**Теорема Гаусса-Бонне:** integral K dA = 2pi*chi(M). Суммарная кривизна = топологический инвариант
**Poincare embeddings и RSGD:** K=-1 гиперболического пространства позволяет вложить иерархии экспоненциально эффективнее R^n

Связанные темы

Theorema Egregium - мост между кривизной, метрикой и топологией:

Гауссова кривизна — K = kappa1*kappa2 определяется внешне в dg-04, здесь выясняется её внутренняя природа
Тензор кривизны Римана — Полный внутренний тензор кривизны - обобщение K на многообразия
Теорема Гаусса-Бонне (полная) — Обобщение, Чёрн-классы, топологические инсуляторы

Вопросы для размышления

На торе integral integral K dA = 0, хотя K меняет знак. Можно ли построить тор с K=0 везде? Плоский тор вкладывается изометрично в R4, но не в R3.
Poincare disk использует евклидову метрику в R2, но расстояние другое. Является ли диск Пуанкаре изометричным евклидовой плоскости? Почему?
Loss landscape нейросети - многообразие в пространстве параметров. Какой смысл имеет 'кривизна' этого многообразия? Является ли она внутренней или внешней характеристикой?

Связанные уроки

dg-04 — K = kappa1*kappa2 через вторую форму - фундамент для Theorema Egregium
dg-10 — Тензор Римана - полное обобщение K на многообразия произвольной размерности
dg-11 — Теорема Гаусса-Бонне во всей силе: Чёрн-классы, топологические инсуляторы
ig-02-fisher-metric — Fisher information metric - кривизна на многообразии вероятностных распределений
ig-07-natural-gradient — Natural gradient - Riemannian SGD на многообразии параметров модели
de-03 — Геодезические уравнения - ОДУ на многообразии с ненулевой кривизной
calc-01-sequences