Математический анализ
Введение в ряды
Цели урока
- Понять, что такое числовой ряд и частичные суммы
- Освоить понятия сходимости и расходимости ряда
- Вывести формулу суммы геометрического ряда
- Доказать расходимость гармонического ряда
- Применять признак Лейбница для знакочередующихся рядов
Предварительные знания
- Последовательности и их пределы
- Арифметическая и геометрическая прогрессии
- Понятие предела: $\lim_{n \to \infty} a_n$
- Свойства пределов: сумма, произведение
Зенон Элейский 2500 лет назад доказал, что Ахиллес никогда не догонит черепаху. Логика железная: сначала добеги до места, где была черепаха, потом до следующего - и так бесконечно. Бесконечно много шагов = никогда. Математики смеялись над парадоксом 2000 лет. Потом посчитали: $\frac{1}{2} + \frac{1}{4} + \frac{1}{8} + \ldots = 1$. Бесконечно много слагаемых. Конечная сумма. Зенон был неправ - и именно это открытие лежит в основе того, как PyTorch вычисляет $\sin x$, как JPEG сжимает изображение, как Adam накапливает градиенты во время обучения GPT.
- **PyTorch `torch.sin(x)`**: внутри - ряд Тейлора $x - x^3/6 + x^5/120 - \ldots$, первые 10 членов дают точность $10^{-15}$. Бесконечный ряд, усечённый до конечного числа членов - именно так CPU считает тригонометрию
- **Adam optimizer**: момент $m_t = \beta_1 m_{t-1} + (1-\beta_1)g_t$ - это геометрический ряд градиентов. При $\beta_1 = 0.9$ слагаемые убывают как $0.9^k$, сумма сходится - вот почему обучение стабилизируется
- **JPEG-сжатие**: изображение раскладывается в ряд Фурье - сумму косинусов с разными частотами. Отбрасывают члены с малым коэффициентом. Ряд из 8x8=64 членов описывает блок из 64 пикселей
- **Базельская проблема Эйлера**: $\sum_{n=1}^\infty \frac{1}{n^2} = \frac{\pi^2}{6} \approx 1.6449$ - формула 1735 года, которую используют в статистике и квантовой физике
- **Непрерывное начисление процентов**: $e^r = \lim_{n \to \infty}(1 + r/n)^n = 1 + r + r^2/2! + \ldots$ - каждый банк, каждая модель дисконтирования считает через этот ряд
Зенон, Архимед и бесконечность
Зенон Элейский (~450 до н.э.) сформулировал парадоксы о бесконечном делении: как Ахиллес может догнать черепаху, если ему нужно пройти бесконечно много отрезков? Архимед (~250 до н.э.) фактически вычислял суммы рядов для нахождения площадей. Но строгую теорию создали только в XIX веке. А в 1735 году Эйлер решил знаменитую Базельскую проблему: $\sum \frac{1}{n^2} = \frac{\pi^2}{6}$, поразив математический мир.
Бесконечная сумма с конечным ответом
Бесконечная сумма с конечным ответом
Зенон прав: если складывать числа одно за другим, процесс не закончится. Но мы не складываем - мы берём **предел**. Вот чем ряд отличается от простой суммы.
Полпути, четверть, восьмая, шестнадцатая... После каждого шага до стены остаётся ровно половина от предыдущего. Члены становятся меньше. Быстро. Асимптотически:
Сумма не может превысить 1 - каждый следующий шаг добавляет меньше, чем не хватает до 1. И в точности равна 1. Не "примерно", не "стремится к" - **равна**. Это не интуиция, это теорема. Проверяется через предел частичных сумм.
**Парадокс Зенона и Adam optimizer**. Та же структура, что у этого ряда, живёт в Adam - самом популярном оптимизаторе в ML. Момент $m_t = 0.9 \cdot m_{t-1} + 0.1 \cdot g_t$ разворачивается в ряд: $m_t = 0.1 g_t + 0.1 \cdot 0.9 \cdot g_{t-1} + 0.1 \cdot 0.9^2 \cdot g_{t-2} + \ldots$ Геометрический ряд со знаменателем $q = 0.9 < 1$. Сходится - значит, оптимизатор стабилен.
Определение числового ряда
**Числовой ряд** - это выражение вида:
Здесь $a_n$ - **члены ряда**. Сложить бесконечно много чисел буквально нельзя. Поэтому сумму ряда определяют через предел. Ряд = не сложение, а процесс, у которого есть предельное состояние.
Частичные суммы - ключ к пониманию
**Частичная сумма** $S_n$ - сумма первых $n$ членов:
- $S_1 = a_1$ - только первый член
- $S_2 = a_1 + a_2$ - первые два
- $S_3 = a_1 + a_2 + a_3$ - первые три
- $S_n = a_1 + a_2 + \ldots + a_n$ - первые $n$ членов
Частичные суммы образуют **последовательность** $S_1, S_2, S_3, \ldots$ - и здесь включается теория из предыдущего урока. Если эта последовательность сходится - ряд сходится.
Предел существует и конечен - ряд **сходится**. Предел бесконечен или не существует - ряд **расходится**.
Путь к стене
Ряд 1/2 + 1/4 + 1/8 + ...
Вернёмся к примеру: $\frac{1}{2} + \frac{1}{4} + \frac{1}{8} + \ldots$ Частичные суммы: - $S_1 = 0.5$ - $S_2 = 0.5 + 0.25 = 0.75$ - $S_3 = 0.875$, $S_4 = 0.9375$, $S_5 = 0.96875$ - $S_{10} \approx 0.999$ Закономерность: $S_n = 1 - \frac{1}{2^n}$ При $n \to \infty$: $\frac{1}{2^n} \to 0$, поэтому $S_n \to 1$ **Сумма бесконечного ряда равна 1.** ML-параллель: кривая training loss убывает по той же форме - каждая эпоха уменьшает расстояние до минимума вдвое (при идеальных условиях). Loss никогда не становится нулём, но предел существует.
| n | $S_n$ | До предела |
|---|---|---|
| 1 | 0.5 | 0.5 |
| 2 | 0.75 | 0.25 |
Геометрический ряд - главный герой
Геометрический ряд - главный герой
Пример выше - частный случай **геометрического ряда**: каждый член получается умножением предыдущего на знаменатель $q$. Этот ряд встречается в ML буквально везде - экспоненциальные скользящие средние в Adam, cosine LR decay, discounting в reinforcement learning.
Для него есть **точная замкнутая формула**. При $|q| < 1$:
Когда геометрический ряд расходится?
Формула работает **только при $|q| < 1$**. Что происходит при $|q| \geq 1$ - это те же три режима расходимости, что у последовательностей:
- $q = 1$: $1 + 1 + 1 + 1 + \ldots = \infty$ - убегание. В ML: learning rate слишком велик, loss взрывается
- $q = -1$: $1 - 1 + 1 - 1 + \ldots$ - колебания между 0 и 1, предела нет. В ML: оптимизатор прыгает через минимум
- $q = 2$: $1 + 2 + 4 + 8 + \ldots = \infty$ - экспоненциальный взрыв
- $q = -2$: $1 - 2 + 4 - 8 + \ldots$ - колебания с растущей амплитудой. Нестабильное обучение.
Условие $|q| < 1$ - это ровно то условие, которое математики ставят на learning rate в теории сходимости SGD. Коэффициент $q$ в геометрическом ряде и коэффициент сокращения в итерации градиентного спуска - один и тот же объект.
Чему равна сумма ряда $1 + \frac{1}{3} + \frac{1}{9} + \frac{1}{27} + \ldots$?
Это геометрический ряд с $q = \frac{1}{3}$. По формуле: $\frac{1}{1 - 1/3} = \frac{1}{2/3} = \frac{3}{2}$.
Гармонический ряд - коварный сюрприз
Гармонический ряд - коварный сюрприз
Члены убывают, убывают, убывают - казалось бы, сумма должна быть конечной. Вот контрпример, который ломает эту интуицию:
Члены стремятся к нулю: $\frac{1}{n} \to 0$. Кажется, ряд сойдётся. **Нет.** Гармонический ряд расходится - его сумма бесконечна. Это самый важный контрпример в математическом анализе. Запомните его.
Доказательство расходимости
Метод группировки Оресма (XIV век!)
Сгруппируем члены: $1 + \frac{1}{2} + \left(\frac{1}{3} + \frac{1}{4}\right) + \left(\frac{1}{5} + \frac{1}{6} + \frac{1}{7} + \frac{1}{8}\right) + \ldots$ Оценим каждую группу снизу: - $\frac{1}{3} + \frac{1}{4} > \frac{1}{4} + \frac{1}{4} = \frac{1}{2}$ - $\frac{1}{5} + \frac{1}{6} + \frac{1}{7} + \frac{1}{8} > 4 \cdot \frac{1}{8} = \frac{1}{2}$ Каждая группа больше $\frac{1}{2}$! Сумма: $> 1 + \frac{1}{2} + \frac{1}{2} + \frac{1}{2} + \ldots = \infty$ Никола Оресм доказал это в XIV веке - за 300 лет до создания математического анализа.
Если члены ряда стремятся к нулю, то ряд сходится
Условие $a_n \to 0$ необходимо, но НЕ достаточно для сходимости
Гармонический ряд - главный контрпример: $\frac{1}{n} \to 0$, но сумма бесконечна. Убывание членов к нулю говорит лишь о том, что сходимость не исключена - не больше. В ML-параллели: если коэффициент шага убывает, это не гарантирует сходимость. SGD требует дополнительных условий (Robbins-Monro: $\sum \eta_t = \infty$, $\sum \eta_t^2 < \infty$).
Гармонический ряд растёт как $\ln n$. Чтобы сумма превысила 10, нужно ~12000 членов. Чтобы превысила 20 - ~270 миллионов. Но в конечном счёте она превысит любое число.
Обобщённый гармонический ряд (p-ряд)
| Условие | Результат | Пример |
|---|---|---|
| $p > 1$ | **Сходится** | $\sum \frac{1}{n^2} = \frac{\pi^2}{6}$ |
| $p = 1$ | **Расходится** | Гармонический ряд |
| $p < 1$ | **Расходится** | $\sum \frac{1}{\sqrt{n}}$ - ещё хуже |
Граница проходит ровно по $p = 1$. При $p = 2$ сумма равна $\frac{\pi^2}{6}$ - знаменитая **Базельская проблема**, решённая Эйлером в 1735 году. Этот результат появляется в дисперсии распределения Коши, в энергетических уровнях атома, в статистике экстремальных значений.
Какой из рядов сходится?
Это p-ряд с p = 2 > 1, поэтому сходится. Все остальные расходятся: гармонический (p = 1), с корнем (p = 1/2 < 1), и ряд с логарифмом (члены убывают медленнее гармонического).
Знакочередующиеся ряды
Знакочередующиеся ряды
Гармонический ряд расходится. Но если чередовать знаки - сходится. Это не закономерно. Чередование знаков "компенсирует" медленное убывание членов - частичные суммы скачут вокруг предела, с каждым шагом всё ближе:
| n | Операция | $S_n$ | Относительно ln2 |
|---|---|---|---|
| 1 | +1 | 1.000 | выше ↑ |
| 2 | $-\frac{1}{2}$ | 0.500 | ниже ↓ |
| 3 | $+\frac{1}{3}$ | 0.833 | выше ↑ |
| 4 | $-\frac{1}{4}$ | 0.583 | ниже ↓ |
| $\infty$ | 0.693 | $= \ln 2$ |
**Признак Лейбница**. Если члены ряда: 1. Чередуют знак: $a_1 - a_2 + a_3 - a_4 + \ldots$ 2. Убывают по модулю: $|a_{n+1}| < |a_n|$ 3. Стремятся к нулю: $a_n \to 0$ То ряд **сходится**.
**Опасность перестановок!**. Нельзя переставлять члены условно сходящегося ряда! Ряд $1 - \frac{1}{2} + \frac{1}{3} - \frac{1}{4} + \ldots = \ln 2$, но перестановкой членов можно получить **любое число** или даже бесконечность. Это теорема Римана о перестановках. В ML: перемешивание данных в батчах не меняет сумму потерь - но перемешивание членов ряда меняет его сумму.
В чём ключевая идея раздела «Знакочередующиеся ряды»?
Перескажите главное определение или результат раздела одним предложением.
Практика
Практика
Найдите сумму геометрического ряда: $2 + 1 + \frac{1}{2} + \frac{1}{4} + \frac{1}{8} + \ldots$
Первый член: $a = 2$ Знаменатель: $q = \frac{1}{2}$ (каждый следующий в 2 раза меньше) $|q| = \frac{1}{2} < 1$ ✓ - ряд сходится Сумма: $S = \frac{a}{1-q} = \frac{2}{1 - 1/2} = \frac{2}{1/2} = 4$ **Ответ: 4**
Докажите, что ряд $\sum_{n=1}^{\infty} \frac{n}{n+1}$ расходится, используя необходимое условие сходимости.
Необходимое условие сходимости: $\lim_{n \to \infty} a_n = 0$ Найдём предел члена ряда: $\lim_{n \to \infty} \frac{n}{n+1} = \lim_{n \to \infty} \frac{1}{1 + 1/n} = \frac{1}{1+0} = 1 \neq 0$ Члены ряда стремятся к 1, а не к 0! Необходимое условие **не выполнено** → ряд **расходится**.
Исследуйте сходимость ряда $\sum_{n=1}^{\infty} \frac{(-1)^n}{\sqrt{n}}$ с помощью признака Лейбница.
Ряд: $-\frac{1}{1} + \frac{1}{\sqrt{2}} - \frac{1}{\sqrt{3}} + \frac{1}{\sqrt{4}} - \ldots$ Проверим условия признака Лейбница: **1. Знакочередование**: $(-1)^n$ даёт чередование знаков ✓ **2. Убывание по модулю**: $|a_n| = \frac{1}{\sqrt{n}}$ $|a_{n+1}| = \frac{1}{\sqrt{n+1}} < \frac{1}{\sqrt{n}} = |a_n|$ ✓ **3. Предел к нулю**: $\lim_{n \to \infty} \frac{1}{\sqrt{n}} = 0$ ✓ Все три условия выполнены! По признаку Лейбница ряд **сходится**. (Заметим: ряд $\sum \frac{1}{\sqrt{n}}$ без знакочередования расходится - это p-ряд с p = 1/2 < 1)
В чём ключевая идея раздела «Практика»?
Перескажите главное определение или результат раздела одним предложением.
Связь с другими темами
Ряды - мост между дискретным и непрерывным
- Последовательности — Частичные суммы - это последовательность
- Пределы функций — Сумма ряда - это предел
- Интегралы — Интегральный признак сходимости
- Ряд Тейлора — Разложение функций в ряды - как PyTorch считает sin(x)
Итоги
- **Ряд** - бесконечная сумма, определяемая как предел частичных сумм $S_n \to S$
- **Геометрический ряд**: $\sum q^n = \frac{1}{1-q}$ при $|q| < 1$ - основа Adam, cosine decay, discounting в RL
- **Гармонический ряд** $\sum \frac{1}{n}$ расходится, несмотря на $a_n \to 0$: самый важный контрпример анализа
- **p-ряд**: сходится при $p > 1$, расходится при $p \leq 1$. При $p = 2$: $\sum 1/n^2 = \pi^2/6$
- **Признак Лейбница**: знакочередование + убывание + $a_n \to 0$ ⇒ ряд сходится
- **Осторожно с перестановками**: условно сходящийся ряд можно переупорядочить до любой суммы
Вопросы для размышления
- Почему необходимое условие ($a_n \to 0$) не является достаточным?
- Adam использует $\beta_1 = 0.9$. Какой геометрический ряд это порождает и какова его сумма?
- Как ряды связаны с вычислением $\pi$, $e$ и других констант?
- Почему перестановка членов условно сходящегося ряда может изменить сумму?