Случайные процессы

Сигнатурные методы для временных рядов

Цели урока

  • Вычислить усечённую сигнатуру пути и проверить тождество Чена
  • Объяснить теорему универсальной аппроксимации через сигнатуру
  • Применить логарифмическую сигнатуру для компактного представления пути
  • Использовать сигнатурное ядро для задач классификации временных рядов

Предварительные знания

  • Теория грубых путей
  • Тензорная алгебра
  • Итерированные интегралы
  • Теория грубых путей

Handwriting recognition с 94.5% точностью - без нейросети, без feature engineering. Только 31 признак из сигнатуры пути. Математическая теорема о плотности линейных функционалов превращается в production-ready ML-метод.

  • Oxford Math Finance: сигнатурные стратегии для forex временных рядов
  • DeepMind: sig-признаки для нерегулярных медицинских временных рядов
  • Sig-Wasserstein GAN: генерация финансовых временных рядов
  • UEA Benchmark: лучший результат на 30+ датасетах временных рядов

От грубых путей к ML

Терри Лайонс определил сигнатуру как часть теории грубых путей в 1990-х. Первые ML-применения: Leerik et al. (2014) для классификации жестов. Прорыв: Chevyrev и Oberhauser (2016) показали универсальность. Esig библиотека для Python создана в Oxford (Reizenstein, 2017). Сигнатурное ядро через PDE - Salvi, Cass et al. (2021). Sig-GAN - Ni, Szpruch et al. (2021). Сегодня sig-методы входят в стандартный toolbox для временных рядов.

Сигнатура пути и теорема универсальной аппроксимации

Теодор Лайонс и Харальд Обербауэр в 2016 году показали: сигнатура пути - универсальный признак для любой непрерывной функции на путях. Google DeepMind использует её для обработки медицинских временных рядов с нерегулярными измерениями. Это не очередной трюк feature engineering - это математическая теорема о плотности.

Усечённая сигнатура порядка N: O(d^N) компонент. Для d=5, N=4: (5^5 - 1)/(5-1) = 781 признак. Логарифмическая сигнатура компактнее: O(d^N / N) независимых компонент через скобки Холла.

Почему сигнатура является универсальным признаком для задач на путях?

Универсальная аппроксимация: линейные L(S(X)) dense в C(paths). Это значит, что любую непрерывную функцию на путях можно аппроксимировать линейной комбинацией компонент сигнатуры.

Логарифмическая сигнатура и вычислительная эффективность

Сигнатура порядка N для d-мерного пути имеет (d^{N+1} - 1)/(d-1) компонент. При d=10, N=5 это 111111 числа. Логарифмическая сигнатура через скобки Холла: O(d^N / N) - в 5 раз меньше. И несёт ту же информацию.

d (размерность)Порядок NРазмер sigРазмер log-sigСжатие
243183.9x
34121186.7x
53156207.8x
10311115520x

Ядро сигнатуры K(X,Y) = inner product в тензорной алгебре - вычисляется через PDE без явного вычисления компонент. Время: O(N * |X| * |Y|) вместо O(d^N * |X| * |Y|). Метод ядра на путях - это SVM без явного признакового пространства.

Библиотеки: esig (Python/C++, основная), iisignature (PyTorch, быстрее для градиентов), signatory (GPU, backprop). Для production: signatory от James Foster интегрируется с torch.autograd.

Чем логарифмическая сигнатура компактнее обычной при том же объёме информации?

Тождество Чена создаёт структурные зависимости между компонентами sig. Логарифм проецирует на свободную алгебру Ли - пространство без этих зависимостей. Размер: O(d^N/N) vs O(d^N) для sig.

Сигнатурные методы в практике ML

Oxford Math Finance Group: сигнатурные признаки для финансовых временных рядов. Signature trading strategy обгоняет LSTM на forex данных. Причина - инвариантность к перепараметризации: разные частоты семплинга, пропуски, нерегулярные сетки не ломают признаки.

Sig-Wasserstein GAN (Ni et al., 2021): дискриминатор - расстояние между сигнатурами реальных и сгенерированных путей. Позволяет обучать генеративные модели для финансовых временных рядов без нестабильности adversarial training.

Signature as features для handwriting recognition

Классификация рукописных символов

Рукописная буква - 2D путь (x(t), y(t)). Скорость написания не должна влиять на распознавание - это перепараметризация. Сигнатура инвариантна к ней. Усечённая сигнатура порядка 4 (d=2, N=4): 31 признак. Линейный SVM на этих признаках даёт 94.5% точности на UEA Multivariate Time Series Archive - без feature engineering, без нейросетей.

Чем сигнатурное ядро K(X,Y) выгодно для ML на путях по сравнению с явным вычислением признаков?

Ядро K(X,Y) = inner product в тензорной алгебре, вычисляемое через PDE за O(|X|*|Y|). При явных признаках порядка N нужно хранить O(d^N) чисел. Kernel метод даёт доступ к бесконечномерным признакам за конечное время.

Связи с другими разделами

Сигнатурные методы соединяют геометрию путей с практическим ML на временных рядах

  • Резервуарные вычисления — Связанная тема
  • Kernel methods (SVM, GP) — Связанная тема
  • Теория грубых путей — Связанная тема
  • Neural CDE — Связанная тема

Итоги

  • Сигнатура - бесконечная тензорная серия итерированных интегралов: S(X) = (1, S^1, S^2, ...)
  • Тождество Чена: S(X*Y) = S(X) tensor S(Y) - мультипликативность при конкатенации
  • Универсальная аппроксимация: линейные L(S(X)) dense в C(paths)
  • Log-signature: O(d^N/N) компонент против O(d^N) для sig - в N раз компактнее

Вопросы для размышления

  • Почему инвариантность к перепараметризации важна для временных рядов с нерегулярным семплингом?
  • Как связаны сигнатурное ядро и Random Fourier Features для аппроксимации kernel матриц?
  • Почему усечение сигнатуры до порядка N всё равно даёт хорошие результаты на практике?

Связанные уроки

  • sp-27 — Сигнатура строится на теории итерированных интегралов
  • sp-29 — Резервуарные вычисления - альтернативный метод для временных рядов
  • sp-23 — Точечные процессы кодируются через сигнатурные признаки
Сигнатурные методы для временных рядов

0

1

Войти