Тригонометрия
Графики тригонометрических функций
Цели урока
- Читать формулу y = A·sin(Bx+C)+D как описание физической волны
- Считать амплитуду, период, фазу и вертикальный сдвиг по графику и обратно
- Видеть связь параметров с positional encoding, AM/FM-модуляцией и STFT
- Понимать суперпозицию синусоид и происхождение биений
Предварительные знания
- Базовые тригонометрические функции sin, cos и их графики
- Радианная мера угла
GPT-4 определяет позицию каждого токена через sin/cos с разными периодами - positional encoding из Vaswani 2017 (Transformer). Whisper STFT: 80 mel-фильтров через sin/cos на минуту. AM-радио, изобретённое в 1906 году, до сих пор живёт в FM, GSM, LTE, 5G и Wi-Fi - все они кодируют биты как фазу синусоиды.
- **Transformer positional encoding (2017):** sin(pos/10000^(2i/d)) - тот же y = A·sin(Bx) внутри GPT-4, Claude, Gemini
- **Whisper STFT:** 30-секундное аудио → 80 mel-фильтров через десятки миллионов sin/cos на каждую минуту речи
- **AM/FM радио → 5G:** A меняется в AM, B - в FM, C - в QPSK/OFDM. Одна формула покрывает 120 лет беспроводной связи
- **ECG в Apple Watch:** QRS-комплекс аппроксимируется суммой синусоид с разными фазами для классификации аритмии
- **Web Audio API в браузере:** OscillatorNode - буквально y = A·sin(2π·f·t) на 44100 Гц, основа всех веб-синтезаторов
Жозеф Фурье - тепло, ряды и вся современная обработка сигналов
В 1822 году Фурье публикует Théorie analytique de la chaleur - книгу о распространении тепла, в которой утверждает, что любая функция раскладывается в сумму синусов и косинусов. Современники не верят: Лагранж публично называет идею ошибочной. Через 60 лет Дирихле находит точные условия, и ряд Фурье становится основой всей цифровой эпохи: MP3, JPEG, MRI, Wi-Fi, 5G, спектрограммы Whisper. Один трактат о тепле - корень DSP, mel-filterbank и positional encoding в Transformer.
Амплитуда и период
**GPT-4 определяет позицию каждого токена через sin/cos с разными периодами - positional encoding из Vaswani 2017 (Transformer).** Формула одна: PE(pos, 2i) = sin(pos / 10000^(2i/d)). Здесь параметр **B = 1/10000^(2i/d)** задаёт период, а амплитуда фиксирована в единице. Та же y = A·sin(Bx) живёт внутри трансформера, в Spotify-эквалайзере, в STFT-окне Whisper - один универсальный шаблон.
**Параметры y = A·sin(Bx+C)+D:** Амплитуда: |A| (максимальное значение = A, минимальное = -A) Период: T = 2π/|B| Фаза (сдвиг): -C/B (горизонтальный сдвиг) Вертикальный сдвиг: D
| Параметр | Эффект на график | ML/системный якорь |
|---|---|---|
| |A| > 1 | Растяжение по вертикали | Усиление полосы в Spotify-эквалайзере (+6 дБ на 250 Гц) |
| |A| < 1 | Сжатие по вертикали | Hann-окно в STFT гасит края до нуля |
| A < 0 | Отражение относительно оси x | Инверсия фазы в active noise cancellation (AirPods Pro) |
| B > 1 | Сжатие по горизонтали - выше частота | sin(2π·440·t) - нота Ля; sin(2π·1e9·t) - GSM-несущая |
| 0 < B < 1 | Растяжение по горизонтали - ниже частота | sin(pos / 10000) - дальние измерения positional encoding |
Амплитуда A влияет на период функции
Период определяется только B: T = 2π/|B|. A масштабирует график по вертикали, не растягивая его по горизонтали
Это легко проверить: sin(x) и 100·sin(x) пересекают ноль ровно в одних и тех же точках, потому что 100·0 = 0. Amplitude и frequency - ортогональные параметры. AM-модуляция эксплуатирует именно это: меняет A, не трогая B (несущую частоту).
Каков период функции y = 3·sin(4x - π)?
Фазовый сдвиг и вертикальный сдвиг
**AM-радио, изобретённое в 1906 году, до сих пор живёт в FM, GSM, LTE, 5G и Wi-Fi - все они кодируют биты как фазу синусоиды.** В y = sin(Bx + C) сдвиг равен -C/B: при C > 0 график сдвигается влево, при C < 0 - вправо. Вертикальный сдвиг D просто поднимает или опускает весь график. QPSK-модулятор в LTE кодирует 2 бита, выбирая одну из 4 фаз: 0, π/2, π, 3π/2 - именно эта величина C становится цифровым символом.
Фазовый сдвиг между двумя колебаниями определяет их взаимодействие. Два сигнала одинаковой частоты с фазовым сдвигом π полностью гасят друг друга (деструктивная интерференция) - принцип активного шумоподавления в AirPods Pro и Bose QC. Микрофон ловит шум, процессор рассчитывает -sin(Bx+C), динамик добавляет инвертированный сигнал, на барабанной перепонке - тишина.
Fourier features в ML: вместо raw timestamps в нейросеть подают sin(2π·t/T) и cos(2π·t/T) для разных периодов T (час, день, неделя, год). Так модель узнаёт сезонность без подбора периода вручную - тот же приём в positional encoding.
Функция y = sin(x - π/4). На сколько и в какую сторону сдвинут её график относительно y = sin(x)?
Наложение гармоник и биения
**Whisper расшифровывает речь: каждая 30-секундная аудиодорожка раскладывается в 80 mel-фильтров через STFT - десятки миллионов sin/cos на минуту.** Любой периодический сигнал раскладывается в сумму синусоидальных составляющих (ряд Фурье). Обратно - суперпозиция нескольких синусоид даёт сложный сигнал. Особый случай: сложение двух синусоид с близкими, но разными частотами порождает **биения** - тот же эффект, что слышен при настройке гитары и виден на спектрограмме речевой модели.
Практическое применение наложения: AM-модуляция - умножение несущей cos(2πf_c·t) на информационный сигнал m(t), что даёт боковые частоты. FM-модуляция меняет частоту несущей. Анализ спектра сигнала - разложение суперпозиции обратно в компоненты (FFT). На осциллографе суперпозиция выглядит как причудливая фигура Лиссажу; на спектрограмме - как набор горизонтальных полос.
Сложение двух синусоид с одинаковой частотой: A·sin(ωt) + B·cos(ωt) = √(A²+B²)·sin(ωt + φ), где tan φ = B/A. Это формула вспомогательного угла - база для анализа цепей переменного тока, импеданса в SDR-радио и комплексной экспоненты в формуле Эйлера.
Сумма двух разных синусоид всегда даёт синусоиду
Сумма синусоид одной частоты - синусоида той же частоты. Сумма синусоид разных частот - уже не чистая синусоида, а более сложный периодический сигнал
Это ключевая интуиция за рядом Фурье: разные частоты не складываются в одну. Whisper, MP3, JPEG - все они эксплуатируют именно это: раскладывают сложный сигнал на простые синусоиды и хранят/обрабатывают их по отдельности.
Два камертона звучат на частотах 256 Гц и 260 Гц. С какой частотой слышны биения?
Ключевые идеи
- **y = A·sin(Bx+C)+D:** амплитуда |A|, период 2π/|B|, фазовый сдвиг -C/B, вертикальный сдвиг D
- **Фаза** сдвигает график горизонтально: C > 0 влево, C < 0 вправо; sin и cos связаны фазовым сдвигом π/2
- **Наложение синусоид** одной частоты: A·sin + B·cos = √(A²+B²)·sin(x+φ) - сумма остаётся синусоидой
- **Биения** при близких частотах: огибающая·несущая, частота пульсаций = |f₁-f₂|
- **Один шаблон** работает в positional encoding GPT, STFT Whisper, AM/FM-радио и ECG Apple Watch
Связанные темы
Графики тригонометрических функций - визуальный язык волн и колебаний:
- Тригонометрия в физике — Параметры y=A·sin(ωt+φ) прямо соответствуют характеристикам простых гармонических колебаний
- Формула Эйлера — eⁱˣ = cos x + i·sin x - комплексная запись синусоиды, которая делает анализ сигналов удобнее
- Тригонометрия в графике и сигналах — FFT раскладывает сложный сигнал на синусоидальные компоненты - практика суперпозиции
- Transformers и positional encoding — sin(pos/10000^(2i/d)) - тот же y = A·sin(Bx) внутри Vaswani 2017
Вопросы для размышления
- Два сигнала: y₁ = sin(x) и y₂ = sin(x + π). Что даёт их сумма? Как это объясняет работу AirPods Pro с активным шумоподавлением?
- Может ли сумма двух разных синусоид снова быть синусоидой? При каких условиях это происходит, а при каких - нет?
- Почему в positional encoding GPT-4 выбраны именно sin/cos с геометрически растущими периодами, а не равномерная сетка частот?
Связанные уроки
- trig-08 — Гармонические колебания: те же A, B, C, D в физике
- trig-11 — FFT раскладывает сигнал на синусоиды - применение суперпозиции
- ml-31-transformers — Positional encoding sin/cos с разными периодами - Vaswani 2017
- aie-23-speech-to-text — Whisper STFT: 80 mel-фильтров через sin/cos на каждом окне
- dsp-01 — Цифровая обработка сигналов начинается с y = A·sin(Bx+C)+D