Геометрия
Гиперболическая геометрия
Цели урока
- Понять три эквивалентные модели H^2: диск Пуанкаре, полуплоскость, гиперболоид
- Изучить геодезические, изометрии и группу PSU(1,1)
- Освоить свойства гиперболических треугольников и угловой дефект
- Увидеть связь с гиперболическими нейронными сетями и вложениями графов
Предварительные знания
- Проективная геометрия
- Гауссова и средняя кривизна
- Гиперболическая геометрия (введение)
Как геометрия, которую считали нереальной 200 лет назад, стала вычислительным инструментом в лучших рекомендательных системах?
- Facebook Research: WordNet (82 тыс. слов) вложен в 2D гиперболическое пространство с ошибкой в 100 раз меньше, чем в 200D евклидовом
- Knowledge graphs: иерархии понятий в Freebase и DBpedia хранятся в гиперболических пространствах для поиска по смыслу
- Теория относительности: пространство скоростей в специальной теории относительности - гиперболическая плоскость с метрикой Минковского
- Рекомендательные системы: HGNN достигает точности на 7% выше евклидового аналога для товарных иерархий
От Лобачевского до Facebook Research
Николай Лобачевский (1830) и Янош Бойяи (1832) независимо построили геометрию с отрицательной кривизной. Их современники считали это бессмыслицей. Гаусс знал результат, но не публиковал - боялся насмешек. Бельтрами в 1868 году доказал, что гиперболическая геометрия реализуется на поверхности в евклидовом пространстве - псевдосфере. Пуанкаре в 1882 году построил диск-модель, изучая автоморфные функции. Модель верхней полуплоскости использовал Клейн в теории форм. В 2017 году Nickel и Kiela из Facebook Research опубликовали 'Poincare Embeddings' - 1200 цитирований за 5 лет.
Модели гиперболической плоскости
2019 год, Facebook Research. Задача: вложить граф иерархии WordNet - 82 115 слов, миллионы отношений - в метрическое пространство. Евклидово пространство размерности 200 даёт ошибку ранжирования 6.9. Гиперболическое пространство размерности 2 - ошибку 0.071. Разрыв в 100 раз при размерности в 100 раз меньше.
Ключевое свойство: объём шара радиуса r растёт как sinh(r) ~ e^r, экспоненциально. Именно поэтому деревья - иерархические структуры с экспоненциальным ростом числа узлов - так хорошо вкладываются в гиперболическое пространство.
Почему гиперболическое пространство лучше евклидового для вложения иерархических данных?
Иерархические структуры растут экспоненциально (дерево с ветвлением b: b^k узлов на уровне k). Объём шара в H^n пропорционален sinh^{n-1}(r) ~ e^{(n-1)r} - тот же экспоненциальный рост. Евклидов шар растёт лишь полиномиально.
Геодезические и группа изометрий
В евклидовой геометрии геодезические - прямые. В гиперболической - нет. Геодезические в диске Пуанкаре - это дуги окружностей, перпендикулярных граничной окружности. Через любые две точки проходит ровно одна геодезическая. Но через точку, не лежащую на данной геодезической, проходит бесконечно много параллельных ей геодезических.
Это и есть суть гиперболической геометрии: пятый постулат Евклида нарушен. Через внешнюю точку проходит не одна параллельная, а бесконечно много. Лобачевский в 1830 году доказал непротиворечивость такой геометрии.
Гиперболические нейронные сети
Poincare Embeddings от Facebook Research
Библиотека geoopt (PyTorch) реализует оптимизацию на многообразиях Пуанкаре. Вместо евклидового градиентного спуска - риманов градиент с проекцией на гиперболическую метрику. HGCN (Hyperbolic Graph Convolutional Network) - свёртка на гиперболических многообразиях - достигает точности 5% лучше евклидового аналога на задачах классификации иерархических графов.
Какими кривыми являются геодезические в модели диска Пуанкаре?
Геодезические в диске Пуанкаре - дуги окружностей, перпендикулярных единичной окружности, плюс диаметры (как предельный случай). Это кратчайшие пути в метрике Пуанкаре.
Кривизна -1 и гиперболические треугольники
Сумма углов треугольника в евклидовой геометрии равна pi. На сфере - больше pi. В гиперболической плоскости - меньше pi. Причём разность pi минус сумма углов равна площади треугольника. Это не совпадение - это прямое следствие теоремы Гаусса-Бонне.
| Свойство | Евклидова | Сферическая (K=+1) | Гиперболическая (K=-1) |
|---|---|---|---|
| Сумма углов треугольника | pi | > pi | < pi |
| Параллельные прямые | 1 через точку | 0 | бесконечно много |
| Рост объёма шара | r^n (полином) | ограничен | e^{(n-1)r} (экспонента) |
| Площадь треугольника | не связана с углами | пропорциональна sum-pi | пропорциональна pi-sum |
Чему равна сумма углов гиперболического треугольника?
В H^2 сумма углов строго меньше pi. Разность pi - (alpha+beta+gamma) - угловой дефект - в точности равна площади треугольника. Идеальный треугольник с вершинами на границе имеет все нулевые углы и площадь pi.
Гиперболические пространства в машинном обучении
Языковые модели работают с иерархиями: слова -> словосочетания -> предложения -> абзацы. Синтаксические деревья, онтологии, knowledge graphs - везде экспоненциальный рост. Евклидов эмбеддинг сжимает эти структуры, теряя информацию. Гиперболический сохраняет её.
Gyrobert и LorentzBERT - трансформеры в гиперболическом пространстве. HGNN (Hyperbolic Graph Neural Network) применяется для рекомендательных систем: иерархия пользователь -> интересы -> товары вкладывается с точностью на 7% выше евклидового аналога. Небольшая математика, большой выигрыш.
Библиотека geoopt для PyTorch реализует оптимизаторы на многообразиях Пуанкаре и гиперболоиде. Всего 3 строки кода отличают евклидовый SGD от риманова: замена torch.optim.SGD на geoopt.optim.RiemannianSGD и параметра на geoopt.ManifoldParameter.
Чем риманов градиент на диске Пуанкаре отличается от евклидова?
Риманов градиент = евклидов градиент, умноженный на (1-|x|^2)^2/4. Это обратный конформный множитель метрики Пуанкаре. У границы диска этот множитель -> 0, то есть риманов градиент намного меньше евклидова - шаги вблизи границы осторожнее.
Связи с другими темами
Гиперболическая геометрия связана с теорией групп, комплексным анализом и машинным обучением.
- Инверсия и стереографическая проекция — Модель Пуанкаре строится через инверсию и стереографическую проекцию
- Гиперболическая геометрия — Базовый курс по неевклидовой геометрии с отрицательной кривизной
- Симплектическая геометрия — Гиперболические многообразия дают примеры симплектических структур через кокасательное расслоение
Итоги
- Диск Пуанкаре: D^2 с метрикой ds^2 = 4|dz|^2/(1-|z|^2)^2, кривизна K = -1
- Геодезические: дуги окружностей, перпендикулярных граничной окружности
- Изометрии: группа PSU(1,1) - мёбиусовы преобразования, сохраняющие диск
- Угловой дефект: Area(triangle) = pi - (alpha+beta+gamma)
- Объём шара растёт экспоненциально: ~ sinh^{n-1}(r) против r^{n-1} в евклиде
- Poincare embeddings: 2D > 200D евклидово для иерархий (WordNet, KB)
Вопросы для размышления
- Почему объём шара в H^n растёт экспоненциально с радиусом, и как это связано с тем, что деревья хорошо вкладываются в гиперболическое пространство?
- Как нарушение пятого постулата Евклида (через точку проходит бесконечно много параллельных) влияет на сумму углов треугольника?
- Чем риманов градиент на многообразии Пуанкаре отличается от евклидова, и почему оптимизация у границы диска ведёт себя иначе?