Тригонометрия
Гиперболические функции
Инженеры XIX века рассчитывали форму цепей и проводов вручную - и получили цепную линию cosh(x/a). Сегодня та же функция tanh(x) - стандартная функция активации в нейронных сетях, от RNN до LSTM. А в трансформерах softmax - не что иное, как многомерное обобщение той же идеи нормализации через экспоненты. Гиперболические функции объединяют физику цепей с глубоким обучением.
- **Нейронные сети:** tanh(x) - классическая функция активации LSTM и GRU, с областью значений (−1, 1) и удобной производной 1−tanh²x
- **Инженерия мостов:** форма подвесного кабеля - цепная линия y = a·cosh(x/a), а не парабола; ошибка 5% на большом пролёте критична
- **Специальная теория относительности:** rapidity (скорость через гиперболический угол) - это arctanh(v/c)
Предварительные знания
Определения sinh, cosh, tanh
Тригонометрические функции параметризуют точки единичной **окружности** x² + y² = 1: x = cos t, y = sin t. Гиперболические функции параметризуют **гиперболу** x² − y² = 1: x = cosh t, y = sinh t. Определения строятся через экспоненты.
**Определения гиперболических функций:** sinh x = (eˣ − e⁻ˣ) / 2 (нечётная функция) cosh x = (eˣ + e⁻ˣ) / 2 (чётная функция) tanh x = sinh x / cosh x = (eˣ − e⁻ˣ) / (eˣ + e⁻ˣ)
| Свойство | Тригонометрические | Гиперболические |
|---|---|---|
| Основное тождество | cos²x + sin²x = 1 | cosh²x − sinh²x = 1 |
| Производная sin/sinh | cos x | cosh x (без минуса!) |
| Производная cos/cosh | −sin x | sinh x (без минуса!) |
| Область значений sin/sinh | [−1, 1] | (−∞, +∞) |
| Область значений tanh | (−1, 1) | (−1, 1) |
| Чётность cosh/cos | чётные | чётные |
| Нечётность sinh/sin | нечётные | нечётные |
Чем tanh(x) отличается от tan(x) по области значений?
Тождества и производные
Тождества гиперболических функций похожи на тригонометрические, но с характерными изменениями знаков. Главное: cosh²x − sinh²x = 1 (минус вместо плюса). Производные: sinh' = cosh и cosh' = sinh - без минуса, в отличие от −sin у cos!
**Правило знаков (теорема Озборна):** для перехода от тригонометрических тождеств к гиперболическим замените cos→cosh, sin→i·sinh (т.е. при произведении двух sin меняйте знак на противоположный). Например: cos²x + sin²x = 1 → cosh²x − sinh²x = 1.
Чему равна производная cosh x?
Обратные гиперболические функции и цепная линия
Обратные гиперболические функции выражаются через логарифм - в этом их принципиальное отличие от обратных тригонометрических. arcsinh, arccosh, arctanh существуют как самостоятельные функции, но компьютер вычисляет их именно через ln.
**Обратные гиперболические через логарифм:** arcsinh x = ln(x + √(x²+1)), x ∈ (−∞, +∞) arccosh x = ln(x + √(x²−1)), x ≥ 1 arctanh x = ½·ln((1+x)/(1−x)), |x| < 1
Цепная линия - форма провисания тяжёлого кабеля между опорами. Это не парабола (как думал Галилей)! Уравнение цепной линии: y = a·cosh(x/a), где a - параметр натяжения. Мосты Золотые Ворота, линии электропередач, цепи - все они описываются через cosh.
В нейронных сетях tanh(x) популярна как функция активации именно потому, что её область значений (−1, 1) центрирована вокруг нуля. В отличие от сигмоиды (0, 1), tanh имеет нулевое среднее - что ускоряет сходимость градиентного спуска.
Форма висящего тяжёлого кабеля описывается функцией:
Ключевые идеи
- **Определения:** sinh x = (eˣ−e⁻ˣ)/2, cosh x = (eˣ+e⁻ˣ)/2, tanh x = sinh x / cosh x
- **Основное тождество:** cosh²x − sinh²x = 1 (минус вместо плюса в сравнении с sin²+cos²=1)
- **Производные без знаков:** (sinh)' = cosh, (cosh)' = sinh, (tanh)' = 1/cosh²x
- **Обратные через логарифм:** arcsinh x = ln(x+√(x²+1)); **цепная линия** y = a·cosh(x/a) - не парабола
Связанные темы
Гиперболические функции связывают анализ, физику и machine learning:
- Формула Эйлера — Связь: cosh x = cos(ix) и sinh x = −i·sin(ix) - мост между тригонометрическими и гиперболическими через мнимый аргумент
- Тригонометрия в физике — Затухающие колебания: e^(−αt)·cos(ωt), а при α > ω решение описывается через sinh и cosh
- Тригонометрия в графике и сигналах — tanh используется в attention-механизмах ранних версий, а в RoPE - комбинация cos/sin позиционного кодирования
Вопросы для размышления
- tanh(x) и логистическая сигмоида σ(x) = 1/(1+e⁻ˣ) похожи по форме. Как они связаны? Когда один лучше другого в качестве функции активации?
- Графики sinh x, cosh x, tanh x в сравнении с sin x, cos x, tan x: какие отличия бросаются в глаза при первом взгляде?
- Почему цепная линия - это cosh, а не парабола? Что физически отличает висящий кабель от траектории брошенного тела?