Тригонометрия

Вейвлет-пакеты, лифтинг и применение в Deep Learning

Кажется, что вейвлеты — устаревшая теория из 90-х. На самом деле lifting scheme лежит внутри JPEG 2000 lossless, scattering transform — конкурент CNN на малых данных, а wavelet packets дали идею дилатированных свёрток (WaveNet, TCN). Этот урок раскрывает три продвинутых техники, которые делают вейвлеты живой темой 2020-х.

  • JPEG 2000 lossless для медицинских снимков использует целочисленное lifting-преобразование 5/3 — без него обратимость в целых числах невозможна.
  • Scattering networks Bruna-Mallat показали 0.43% ошибки на MNIST без backprop — это конкурентно с обученными CNN при на порядок меньшем числе параметров.
  • DeepMind WaveNet и Bai et al. TCN моделируют речь и временные ряды через дилатированные свёртки, которые математически эквивалентны фильтрам вейвлет-пакетов.

Предварительные знания

  • Базовая теория вейвлетов и MRA
  • Гильбертовы пространства, ортонормированные базисы в L^2
  • Свёрточные нейросети — общая идея фильтра и дилатации

Вейвлет-пакеты: разложение и выбор лучшего базиса

Стандартное вейвлет-преобразование разлагает только низкочастотный поддиапазон на каждом уровне. Coifman и Wickerhauser в 1992 году обобщили схему: разлагаются ОБА поддиапазона, что даёт древо 2^n листьев на уровне n. Среди всех 2^{2^n - 1} возможных базисов алгоритм best basis выбирает оптимальный по энтропии Шеннона за O(N log N).

Best-basis выигрывает для сигналов с энергией в средних частотах: музыкальные транзиенты, биомедицинские паттерны (QRS-комплекс), вибросигналы машин. DWT разрешает только низкие частоты, а пакеты — весь спектр.

Сколько разных ортонормированных базисов доступно при разложении вейвлет-пакетов глубины n?

Lifting scheme: вейвлеты второго поколения

Sweldens в 1996 году предложил конструировать вейвлеты прямо в сигнальной области, без преобразования Фурье. Lifting даёт целочисленные обратимые преобразования (нужны для сжатия без потерь, JPEG 2000 lossless), быстрее DWT в 2 раза, и работает на нерегулярных сетках, графах, сферах.

(1) Обратимость в целых числах: x → (s,d) → x без округлений. (2) In-place: не нужна память на копию сигнала. (3) Адаптивность: предиктор P может зависеть от данных. (4) Геометрия: работает на триангулированных сетках 3D-моделей (subdivision wavelets).

Зачем нужен шаг update в lifting-схеме?

Scattering transform и WaveNet: вейвлеты внутри нейросетей

Mallat в 2012-м предложил scattering transform — каскад из CWT с модулем и усреднением. Это даёт инвариантное к переносу, стабильное к деформациям представление, обучаемое БЕЗ обратного распространения. На MNIST scattering + SVM достигает 0.43% ошибки. Параллельно WaveNet (DeepMind, 2016) использует дилатированные свёртки, которые математически эквивалентны фильтрам вейвлет-пакетов.

Дилатированная свёртка WaveNet с шагом 2^k реализует фильтр на масштабе 2^k — точно как вейвлет-пакет уровня k. Разница: WaveNet обучает фильтры из данных, а классические вейвлеты фиксированы. Современные TCN (Bai et al. 2018) — это, по сути, обучаемые wavelet packet networks.

Почему scattering transform даёт устойчивые признаки без обучения?

Итоги

  • Wavelet packets разлагают весь спектр; алгоритм best-basis Coifman-Wickerhauser выбирает оптимальный разрез за $O(N\log N)$ по энтропии Шеннона.
  • Lifting scheme — вычислительная схема вейвлетов в сигнальной области, дающая обратимость в целых числах, in-place и работу на нерегулярных областях.
  • Scattering transform — каскад $|CWT|$ + усреднение; даёт Lipschitz-устойчивость к диффеоморфизмам без обучения (Bruna-Mallat).
  • Дилатированные свёртки WaveNet и TCN — обучаемые потомки wavelet packets.

Связь с другими темами

Урок 24 даёт базовую теорию вейвлетов и MRA. Урок 19 (ряды Фурье) — гармонический контрапункт: единственное разрешение vs. мультимасштабность. В курсе по DL scattering transform и дилатированные свёртки нашли применение в аудио, time-series и графовых нейросетях.

  • Базовая теория вейвлетов и MRA — Предшествующий урок (trig-24)
  • Ряды Фурье — Гармонический контрапункт (trig-19)
  • Свёрточные нейросети — Применение scattering и дилатированных свёрток
  • Сжатие без потерь JPEG 2000 — Прямое применение lifting
Вейвлет-пакеты, лифтинг и применение в Deep Learning

0

1

Войти