Дифференциальная геометрия
Тензор кривизны Римана
Общая теория относительности Эйнштейна - это геометрия 4D пространства-времени: материя изгибает пространство через тензор Риччи. В ML исследователи используют гиперболические пространства с отрицательной секционной кривизной для вложения иерархий с минимальным искажением. Одна и та же математика - тензор Римана - описывает чёрные дыры и семантические деревья.
- **Общая теория относительности:** уравнения Эйнштейна G_μν = 8πT_μν. Гравитация - кривизна 4D пространства-времени
- **Poincaré embeddings:** вложение WordNet в H² снижает искажение с 50% до 10% по сравнению с евклидовым пространством
- **Riemannian optimization:** кривизна влияет на скорость сходимости - в пространствах с K < 0 некоторые методы сходятся быстрее
Предварительные знания
Тензор кривизны Римана
**Тензор Римана** измеряет, насколько ковариантная производная не коммутирует: R(X,Y)Z = ∇ₓ∇ᵧZ − ∇ᵧ∇ₓZ − ∇_{[X,Y]}Z. Если кривизна нулевая, порядок дифференцирования не важен - пространство 'плоское'.
В координатах: Rˡₖᵢⱼ = ∂ᵢΓˡⱼₖ − ∂ⱼΓˡᵢₖ + ΓˡᵢₘΓᵐⱼₖ − ΓˡⱼₘΓᵐᵢₖ. Компонент - 4-тензор ранга (1,3). В n-мерии: n²(n²−1)/12 независимых компонент (для n=4: 20).
| Пространство | K (секционная) | Тензор Римана |
|---|---|---|
| R^n (евклидово) | 0 | R = 0 (плоское) |
| S^n(r) (сфера) | 1/r² | R_{ijkl} = (1/r²)(g_{ik}g_{jl}−g_{il}g_{jk}) |
| H^n(r) (гиперболич.) | −1/r² | R_{ijkl} = −(1/r²)(g_{ik}g_{jl}−g_{il}g_{jk}) |
| Общее риманово | переменная | R ≠ 0 (содержательная кривизна) |
Тензор Римана R(X,Y)Z измеряет некоммутативность ковариантной производной. Что это означает физически?
Секционная кривизна, Риччи и скалярная
**Секционная кривизна** K(X,Y) = R(X,Y,Y,X) / (|X|²|Y|² − (X·Y)²) - кривизна двумерного сечения, натянутого на X и Y. Обобщает гауссову кривизну на многомерие. Для n=2 K(X,Y) = Гауссова K.
**Тензор Риччи** Ric(X,Y) = tr(Z ↦ R(Z,X)Y) - свёртка (след) тензора Римана. **Скалярная кривизна** S = tr(g⁻¹ Ric) - дальнейшая свёртка. В общей теории относительности: уравнения Эйнштейна G_μν = Ric_μν − (S/2)g_μν = 8πT_μν (G - тензор Эйнштейна, T - тензор энергии-импульса).
**Теорема Хопфа:** полное связное риманово многообразие постоянной секционной кривизны K: K > 0 - сфера Sⁿ; K = 0 - евклидово пространство Rⁿ (или плоский торус); K < 0 - гиперболическое пространство Hⁿ. В ML: Poincaré embeddings используют H^n для иерархических данных.
Скалярная кривизна S сферы S³(R=1) равна:
Уравнения Эйнштейна и пространства постоянной кривизны
**Уравнения Эйнштейна (1915):** G_μν ≡ Ric_μν − (S/2)g_μν = 8πG/c⁴ · T_μν. Левая часть - геометрия пространства-времени (тензор Эйнштейна), правая - распределение энергии и импульса (тензор энергии-импульса). "Материя говорит пространству, как изгибаться; пространство говорит материи, как двигаться".
В ML гиперболические пространства (K < 0) используются для вложения иерархических структур: деревья "растут экспоненциально", и H^n вмещает их с малым искажением. **Модель Пуанкаре:** H^n ≅ {x ∈ Rⁿ : |x| < 1} с метрикой ds² = 4/(1−|x|²)² Σ dxᵢ².
**Poincaré embeddings (Nickel & Kiela, 2017):** вложение иерархий (WordNet, таксономии) в H² с ~10% искажения против ~50% в евклидовом пространстве той же размерности. Причина: в H^n объём растёт экспоненциально с расстоянием, как и число узлов дерева.
Почему гиперболическое пространство H^n лучше подходит для вложения иерархических данных (деревьев), чем евклидово R^n?
Ключевые идеи
- **Тензор Римана** R(X,Y)Z = ∇ₓ∇ᵧZ − ∇ᵧ∇ₓZ − ∇_{[X,Y]}Z измеряет некоммутативность ковариантного дифференцирования
- **Иерархия:** R_ijkl → Ric_ij (свёртка) → S (скалярная). Для сферы S^n(R): K=1/R², Ric=(n−1)K·g, S=n(n−1)K
- **Уравнения Эйнштейна:** Ric − (S/2)g = 8πT. Геометрия (Риччи) = материя (тензор энергии-импульса)
- **Пространства K=const:** K>0 - сфера, K=0 - евклидово, K<0 - гиперболическое (H^n для Poincaré embeddings)
Связанные темы
Тензор Римана - вершина дифференциально-геометрической иерархии:
- Связности и ковариантная производная — Тензор Римана - мера некоммутативности ∇ₓ и ∇ᵧ
- Теорема Гаусса-Бонне — Интеграл от скалярной кривизны S = топологический инвариант (теорема Хирна-Гаусса-Бонне)
- Дифференциальная геометрия в ML — Гиперболические NN (H^n), Poincaré GNN, натуральный градиент (метрика Фишера)
Вопросы для размышления
- Тождество Бьянки: ∇[ₓR(Y,Z)] + (циклические перестановки) = 0. В ОТО это следует из закона сохранения энергии-импульса ∇_μ G^μν = 0. Как геометрический факт порождает физический закон?
- Poincaré embeddings помещают иерархии в H². Почему 2-мерное гиперболическое пространство часто лучше 100-мерного евклидова? Что происходит с ёмкостью H^n при увеличении кривизны (уменьшении R)?
- В Riemannian optimization кривизна K влияет на сходимость: при K > 0 геодезические сходятся (сфера), при K < 0 расходятся (гиперболическое). Как это влияет на выбор шага обучения в Riemannian gradient descent?