Дифференциальная геометрия

Тензор кривизны Римана

Общая теория относительности Эйнштейна - это геометрия 4D пространства-времени: материя изгибает пространство через тензор Риччи. В ML исследователи используют гиперболические пространства с отрицательной секционной кривизной для вложения иерархий с минимальным искажением. Одна и та же математика - тензор Римана - описывает чёрные дыры и семантические деревья.

**Общая теория относительности:** уравнения Эйнштейна G_μν = 8πT_μν. Гравитация - кривизна 4D пространства-времени
**Poincaré embeddings:** вложение WordNet в H² снижает искажение с 50% до 10% по сравнению с евклидовым пространством
**Riemannian optimization:** кривизна влияет на скорость сходимости - в пространствах с K < 0 некоторые методы сходятся быстрее

Предварительные знания

Connections and Covariant Derivative

Тензор кривизны Римана

**Тензор Римана** измеряет, насколько ковариантная производная не коммутирует: R(X,Y)Z = ∇ₓ∇ᵧZ − ∇ᵧ∇ₓZ − ∇_{[X,Y]}Z. Если кривизна нулевая, порядок дифференцирования не важен - пространство 'плоское'.

В координатах: Rˡₖᵢⱼ = ∂ᵢΓˡⱼₖ − ∂ⱼΓˡᵢₖ + ΓˡᵢₘΓᵐⱼₖ − ΓˡⱼₘΓᵐᵢₖ. Компонент - 4-тензор ранга (1,3). В n-мерии: n²(n²−1)/12 независимых компонент (для n=4: 20).

Пространство	K (секционная)	Тензор Римана
R^n (евклидово)	0	R = 0 (плоское)
S^n(r) (сфера)	1/r²	R_{ijkl} = (1/r²)(g_{ik}g_{jl}−g_{il}g_{jk})
H^n(r) (гиперболич.)	−1/r²	R_{ijkl} = −(1/r²)(g_{ik}g_{jl}−g_{il}g_{jk})
Общее риманово	переменная	R ≠ 0 (содержательная кривизна)

Тензор Римана R(X,Y)Z измеряет некоммутативность ковариантной производной. Что это означает физически?

Секционная кривизна, Риччи и скалярная

**Секционная кривизна** K(X,Y) = R(X,Y,Y,X) / (|X|²|Y|² − (X·Y)²) - кривизна двумерного сечения, натянутого на X и Y. Обобщает гауссову кривизну на многомерие. Для n=2 K(X,Y) = Гауссова K.

**Тензор Риччи** Ric(X,Y) = tr(Z ↦ R(Z,X)Y) - свёртка (след) тензора Римана. **Скалярная кривизна** S = tr(g⁻¹ Ric) - дальнейшая свёртка. В общей теории относительности: уравнения Эйнштейна G_μν = Ric_μν − (S/2)g_μν = 8πT_μν (G - тензор Эйнштейна, T - тензор энергии-импульса).

**Теорема Хопфа:** полное связное риманово многообразие постоянной секционной кривизны K: K > 0 - сфера Sⁿ; K = 0 - евклидово пространство Rⁿ (или плоский торус); K < 0 - гиперболическое пространство Hⁿ. В ML: Poincaré embeddings используют H^n для иерархических данных.

Скалярная кривизна S сферы S³(R=1) равна:

Уравнения Эйнштейна и пространства постоянной кривизны

**Уравнения Эйнштейна (1915):** G_μν ≡ Ric_μν − (S/2)g_μν = 8πG/c⁴ · T_μν. Левая часть - геометрия пространства-времени (тензор Эйнштейна), правая - распределение энергии и импульса (тензор энергии-импульса). "Материя говорит пространству, как изгибаться; пространство говорит материи, как двигаться".

В ML гиперболические пространства (K < 0) используются для вложения иерархических структур: деревья "растут экспоненциально", и H^n вмещает их с малым искажением. **Модель Пуанкаре:** H^n ≅ {x ∈ Rⁿ : |x| < 1} с метрикой ds² = 4/(1−|x|²)² Σ dxᵢ².

**Poincaré embeddings (Nickel & Kiela, 2017):** вложение иерархий (WordNet, таксономии) в H² с ~10% искажения против ~50% в евклидовом пространстве той же размерности. Причина: в H^n объём растёт экспоненциально с расстоянием, как и число узлов дерева.

Почему гиперболическое пространство H^n лучше подходит для вложения иерархических данных (деревьев), чем евклидово R^n?

Ключевые идеи

**Тензор Римана** R(X,Y)Z = ∇ₓ∇ᵧZ − ∇ᵧ∇ₓZ − ∇_{[X,Y]}Z измеряет некоммутативность ковариантного дифференцирования
**Иерархия:** R_ijkl → Ric_ij (свёртка) → S (скалярная). Для сферы S^n(R): K=1/R², Ric=(n−1)K·g, S=n(n−1)K
**Уравнения Эйнштейна:** Ric − (S/2)g = 8πT. Геометрия (Риччи) = материя (тензор энергии-импульса)
**Пространства K=const:** K>0 - сфера, K=0 - евклидово, K<0 - гиперболическое (H^n для Poincaré embeddings)

Связанные темы

Тензор Римана - вершина дифференциально-геометрической иерархии:

Связности и ковариантная производная — Тензор Римана - мера некоммутативности ∇ₓ и ∇ᵧ
Теорема Гаусса-Бонне — Интеграл от скалярной кривизны S = топологический инвариант (теорема Хирна-Гаусса-Бонне)
Дифференциальная геометрия в ML — Гиперболические NN (H^n), Poincaré GNN, натуральный градиент (метрика Фишера)

Вопросы для размышления

Тождество Бьянки: ∇[ₓR(Y,Z)] + (циклические перестановки) = 0. В ОТО это следует из закона сохранения энергии-импульса ∇_μ G^μν = 0. Как геометрический факт порождает физический закон?
Poincaré embeddings помещают иерархии в H². Почему 2-мерное гиперболическое пространство часто лучше 100-мерного евклидова? Что происходит с ёмкостью H^n при увеличении кривизны (уменьшении R)?
В Riemannian optimization кривизна K влияет на сходимость: при K > 0 геодезические сходятся (сфера), при K < 0 расходятся (гиперболическое). Как это влияет на выбор шага обучения в Riemannian gradient descent?

Связанные уроки

la-13-eigenvectors

Тензор кривизны Римана

Пространство

K (секционная)

Тензор Римана

R^n (евклидово)

R = 0 (плоское)

S^n(r) (сфера)

1/r²

R_{ijkl} = (1/r²)(g_{ik}g_{jl}−g_{il}g_{jk})

H^n(r) (гиперболич.)

−1/r²

R_{ijkl} = −(1/r²)(g_{ik}g_{jl}−g_{il}g_{jk})

Общее риманово

переменная

R ≠ 0 (содержательная кривизна)

Тензор Римана R(X,Y)Z измеряет некоммутативность ковариантной производной. Что это означает физически?

Секционная кривизна, Риччи и скалярная

Скалярная кривизна S сферы S³(R=1) равна:

Уравнения Эйнштейна и пространства постоянной кривизны

Ключевые идеи

**Тензор Римана** R(X,Y)Z = ∇ₓ∇ᵧZ − ∇ᵧ∇ₓZ − ∇_{[X,Y]}Z измеряет некоммутативность ковариантного дифференцирования

**Иерархия:** R_ijkl → Ric_ij (свёртка) → S (скалярная). Для сферы S^n(R): K=1/R², Ric=(n−1)K·g, S=n(n−1)K

**Уравнения Эйнштейна:** Ric − (S/2)g = 8πT. Геометрия (Риччи) = материя (тензор энергии-импульса)

**Пространства K=const:** K>0 - сфера, K=0 - евклидово, K<0 - гиперболическое (H^n для Poincaré embeddings)