Дифференциальные уравнения
ОДУ второго порядка
1940. Штат Вашингтон. Мост Такома-Нэрроуз раскачивается в ветер 64 км/ч и через 4 часа рассыпается. 2018. NeurIPS, Монреаль. Neural ODE переворачивает архитектуру нейросетей, показав что ResNet - это метод Эйлера для решения ОДУ $dh/dt = f(h, t, \theta)$. Оба события описываются одним уравнением $y'' + ay' + by = f(x)$. Разница только в том, разрушает ли правая часть систему - или обучает её.
- **Neural ODE (Chen et al. NeurIPS 2018):** скрытое состояние как непрерывное ОДУ. ResNet - частный случай с шагом Эйлера delta_t=1. Нужно понять 2-й порядок, чтобы понять почему это работает
- **Диффузионные модели (DDPM, Stable Diffusion, FLUX):** форвард-процесс добавляет шум через стохастическое ОДУ. Обратная генерация - интегрирование обратного ОДУ. Без теории ОДУ невозможно понять архитектуру
- **Kalman filter:** оптимальный фильтр для линейных ОДУ с гауссовским шумом. Используется в GPS, Tesla autopilot, роботах Boston Dynamics для fusion данных с датчиков
- **Строительство:** расчёт сейсмостойкости зданий - ОДУ 2-го порядка с периодическим возмущением. Каждый небоскрёб - решённая задача о резонансе
Предварительные знания
Характеристическое уравнение
2018 год. NeurIPS, Монреаль. Tian Qi Chen представляет Neural ODE - непрерывную нейронную сеть, где скрытое состояние описывается дифференциальным уравнением $dh/dt = f(h, t, \theta)$. ResNet - это дискретная версия этого уравнения: $h_{t+1} = h_t + F(h_t)$ - шаг метода Эйлера с $\Delta t = 1$. Одно озарение - и дискретная архитектура превратилась в численный метод решения ОДУ. Чтобы понять, почему это работает, нужно сначала понять второй порядок.
Линейное ОДУ 2-го порядка с постоянными коэффициентами: $y'' + ay' + by = 0$. Подставляем пробное решение $y = e^{rx}$: производные дают $y' = re^{rx}$, $y'' = r^2 e^{rx}$. После подстановки и деления на $e^{rx} \neq 0$ остаётся **характеристическое уравнение** $r^2 + ar + b = 0$. Дифференцирование заменилось умножением на $r$ - это зародыш преобразования Лапласа.
| Дискриминант | Корни | Решение | Физика |
|---|---|---|---|
| D > 0 | r1 != r2 (вещ.) | C1*e^(r1*x) + C2*e^(r2*x) | Переходные процессы |
| D = 0 | r1 = r2 = r | (C1 + C2*x)*e^(r*x) | Критическое демпфирование |
| D < 0 | alpha +/- beta*i | e^(alpha*x)*(C1*cos(beta*x) + C2*sin(beta*x)) | Затухающие колебания |
Подстановка $y = e^{rx}$ превращает дифференциальное уравнение в алгебраическое. Это не трюк - это принцип, на котором стоит всё операционное исчисление. Инженеры используют преобразование Лапласа именно по этой причине: сложные ОДУ превращаются в полиномиальные уравнения относительно $r$.
Характеристическое уравнение: r^2 + 6r + 9 = 0. Каковы корни?
Три режима: переходный, критический, колебательный
Мост Такома-Нэрроуз, 7 ноября 1940 года. Ветер 64 км/ч - ничего особенного по нагрузке. Мост начинает раскачиваться и через 4 часа рассыпается. Причина: ветер попал в резонанс с собственной частотой конструкции. Три режима ОДУ 2-го порядка - это три сценария для любой колебательной системы от моста до электрической цепи.
**Случай D > 0** - два различных вещественных корня $r_1, r_2$. Решение: $y = C_1 e^{r_1 x} + C_2 e^{r_2 x}$. Сумма двух экспонент - переходный процесс. Если оба корня отрицательные, система затухает без колебаний. Именно этот режим описывает переходные процессы в RLC-цепях: заряд конденсатора после подачи напряжения.
**Случай D = 0** - кратный корень $r$. Одного $e^{rx}$ недостаточно - нужны два линейно независимых решения. Второе: $xe^{rx}$. Общее: $y = (C_1 + C_2 x)e^{rx}$. Это **критическое демпфирование** - возврат в равновесие без единого колебания, максимально быстро. Именно этот режим ищут инженеры для дверных доводчиков и амортизаторов автомобиля.
**Случай D < 0** - комплексные корни $\alpha \pm \beta i$. Формула Эйлера $e^{i\theta} = \cos\theta + i\sin\theta$ превращает комплексную экспоненту в вещественное решение: $y = e^{\alpha x}(C_1 \cos(\beta x) + C_2 \sin(\beta x))$. При $\alpha < 0$ - затухающие колебания. При $\alpha = 0$ - чистые незатухающие. При $\alpha > 0$ - нарастающий резонанс, как у Такомы.
Даламбер и Эйлер (1747-1749)
Жан Лерон Даламбер вывел волновое уравнение для колебаний струны - ОДУ 2-го порядка в своей основе. Его метод подстановки $y = e^{rx}$ стал стандартным. Два года спустя Эйлер добавил комплексные корни и формулу $e^{i\theta} = \cos\theta + i\sin\theta$ - отчего вещественное решение выходит из комплексной алгебры. Neural ODE 2018 - это тот же Даламбер, только с обучаемой правой частью $f(h, t, \theta)$.
Параметр затухания $\zeta$ (дзета) определяет режим: $\zeta < 1$ - колебания, $\zeta = 1$ - критический, $\zeta > 1$ - передемпфирование. В градиентном спуске есть прямая аналогия: momentum $\beta_1 = 0.9$ в Adam - это система с $\zeta \approx 0.16$, слегка недодемпфированная, что помогает проходить седловые точки.
Уравнение y'' + 4y = 0. Какой тип решения?
Метод неопределённых коэффициентов и резонанс
Диффузионные модели - Stable Diffusion, DALL-E 3, FLUX - добавляют шум по уравнению $dx = -x\,dt + \sigma\,dW$. Это стохастическое ОДУ. Обратный процесс генерации - интегрирование обратного ОДУ. Детерминированная часть этого уравнения - неоднородное ОДУ: $y' + y = f(t)$, где $f(t)$ - «управляющий сигнал». Метод неопределённых коэффициентов отвечает на вопрос: как найти частное решение для конкретной правой части.
Для неоднородного уравнения $y'' + ay' + by = f(x)$ общее решение = однородная часть + **частное решение**. Метод неопределённых коэффициентов: угадываем форму частного решения по виду $f(x)$, подставляем и находим коэффициенты. Угадывание здесь - не случайное: форма жёстко определяется типом правой части.
| Правая часть f(x) | Пробное решение y_p | Условие |
|---|---|---|
| Pn(x) - полином степени n | Qn(x) - полином степени n | 0 - не корень хар. ур. |
| e^(alpha*x) | A*e^(alpha*x) | alpha - не корень |
| e^(alpha*x), alpha - простой корень | A*x*e^(alpha*x) | Умножаем на x |
| cos(beta*x) или sin(beta*x) | A*cos(beta*x) + B*sin(beta*x) | +-i*beta - не корень |
| e^(alpha*x)*Pn(x) | e^(alpha*x)*Qn(x) | Комбинация |
**Резонанс.** Если $\alpha$ - корень характеристического уравнения кратности $k$, умножаем пробное решение на $x^k$. Без этого коэффициенты обнулятся и система не разрешится. Физически: внешняя сила попадает в собственную частоту - энергия накапливается без потерь. Так разрушился мост Такома-Нэрроуз.
**Принцип суперпозиции:** если $y_1$ - частное решение для $f_1(x)$, а $y_2$ - для $f_2(x)$, то $y_1 + y_2$ - частное решение для $f_1 + f_2$. Линейность позволяет разбивать сложные правые части на простые. В ML аналог: loss = reconstruction_loss + KL_divergence - это тот же принцип суперпозиции для градиентов.
y'' + y = sin(x). Характеристическое уравнение r^2 + 1 = 0, корни r = +-i. Какую форму y_p выбрать?
Метод вариации постоянных
Метод неопределённых коэффициентов работает только для «угадываемых» правых частей. Physics-Informed Neural Networks (PINN) - DeepMind GraphCast, климатические модели, моделирование турбулентности - требуют решать ОДУ с произвольными данными в правой части. Для этого нужен универсальный метод.
**Метод вариации постоянных (Лагранж, 1774).** Берём общее решение однородного $C_1 y_1 + C_2 y_2$ и «расконстантиваем» - позволяем $C_1(x)$, $C_2(x)$ зависеть от $x$. Подставляем $y = C_1(x)y_1 + C_2(x)y_2$ и накладываем условие $C_1'y_1 + C_2'y_2 = 0$ (иначе система переопределена). Получаем систему из двух уравнений для $C_1'$ и $C_2'$, решаемую через определитель Вронского.
| Шаг | Формула | Пояснение |
|---|---|---|
| 1. Вронскиан | W = y1*y2' - y2*y1' | Определитель фундаментальной системы |
| 2. Найти C1' | C1' = -y2*f(x)/W | Из системы уравнений |
| 3. Найти C2' | C2' = y1*f(x)/W | Из системы уравнений |
| 4. Интегрировать | C1 = integral(C1' dx), C2 = integral(C2' dx) | Может потребовать спец. функций |
| 5. Собрать | y_p = C1(x)*y1 + C2(x)*y2 | Частное решение |
**Вронскиан W != 0** гарантирует, что $y_1$ и $y_2$ линейно независимы и система для $C_1'$, $C_2'$ имеет единственное решение. Если W = 0 - решения линейно зависимы. Вронский (1778-1853) - польский математик, который ввёл этот определитель за полвека до того, как его применение к ОДУ стало стандартным.
Полная картина: $y'' + ay' + by = f(x)$ - это «$F = ma$» в математической форме. Характеристическое уравнение показывает, будет ли система колебаться или затухать. Неопределённые коэффициенты дают частное решение для стандартных воздействий. Вариация постоянных - для произвольного $f(x)$. Этот же принцип работает в adjoint method - способе вычисления градиентов через Neural ODE, который описан в статье Chen et al. 2018.
Резонанс - чисто физическое явление
Резонанс - математическое явление: правая часть совпадает с решением однородного. Амплитуда растёт линейно по времени.
Когда f(x) = e^(rx), а r - корень характеристического уравнения, стандартная подстановка даёт 0 = f(x) - противоречие. Математически необходимо умножить на x. Физически: внешняя сила попадает в собственную частоту, энергия накапливается. Мост Такома (1940) и разрушение бокала звуком - оба случая резонанса.
Для y'' - y = e^x/x метод неопределённых коэффициентов не работает. Почему?
Ключевые идеи
- **Характеристическое уравнение** $r^2 + ar + b = 0$ сводит ОДУ к алгебраическому - зародыш преобразования Лапласа
- **Три режима:** переходные процессы (D>0), критическое демпфирование (D=0) - дверные доводчики и амортизаторы, колебания (D<0) - от квантового осциллятора до RLC-цепей
- **Неопределённые коэффициенты:** угадываем форму y_p по правой части; если alpha - корень - умножаем на x^k (резонанс)
- **Вариация постоянных:** универсальный метод через Вронскиан для любой правой части. Adjoint method в Neural ODE - его непрерывный аналог
Связанные темы
ОДУ 2-го порядка - центральная тема анализа колебательных систем:
- ОДУ первого порядка — Фундамент: методы 1-го порядка используются при решении 2-го
- Системы ОДУ — ОДУ 2-го порядка эквивалентно системе двух ОДУ 1-го порядка
- Динамические системы — Фазовые портреты и аттракторы - геометрия решений ОДУ
Вопросы для размышления
- Критическое демпфирование (D = 0) - самое быстрое возвращение без колебаний. Почему передемпфированная система (D > 0, два отрицательных корня) возвращается медленнее, хотя тоже не колеблется?
- Neural ODE заменяет дискретные слои ResNet непрерывным ОДУ. Какой из трёх режимов (D>0, D=0, D<0) описывает поведение скрытого состояния в стабильно обученной сети?
- Мост Такома разрушился от резонанса при ветре 64 км/ч. Инженеры теперь рассчитывают собственные частоты конструкций заранее. Как характеристическое уравнение позволяет это сделать аналитически?
Связанные уроки
- de-01 — Методы 1-го порядка - база перед 2-м
- de-03 — ОДУ 2-го порядка эквивалентно системе двух ОДУ 1-го
- dyn-01 — Фазовые портреты и аттракторы для колебательных систем
- nm-01 — Численные методы - как решать ОДУ когда нет аналитики
- calc-01-sequences — Предел и сходимость - фундамент для анализа устойчивости
- la-13-eigenvectors