Топология

TDA для time series: Takens embedding и финансовые катастрофы

Цели урока

Понять теорему Такенса и delay-вложение скалярных рядов
Освоить sliding window TDA для нестационарных сигналов
Изучить persistent entropy как скалярную меру топологической сложности
Узнать о топологических ранних предупреждениях критических переходов
Разобрать применения к ЭКГ, финансовым рынкам и климату

Предварительные знания

Persistent homology и Vietoris-Rips комплекс
Основы динамических систем (аттракторы, бифуркации)
Линейная алгебра над полем
Базовые понятия теории вероятностей (автокорреляция, дисперсия)

1987. Чёрный понедельник. Dow Jones -22.6%. Топология рынка упростилась за месяц до этого. TDA увидела сигнал, который никто не услышал.

**Cardiology**: классификация аритмий через TDA признаки ЭКГ (Pereira & de Mello 2015)
**Finance**: ранние предупреждения о рыночных обвалах через persistent entropy (Gidea & Katz 2018)
**Climate science**: анализ El Nino циклов через sliding window TDA (Berwald & Gidea 2014)
**Industrial IoT**: предсказание поломок оборудования через топологию sensor data (Ayasdi)

От Такенса до topological time series

Флорис Такенс доказал свою теорему о вложении в 1981 году в статье Detecting Strange Attractors in Turbulence - landmark paper теории динамических систем. Связь с TDA сделана много позже: Perea и Harer (2015) установили теоретические гарантии persistence sliding windows для периодических сигналов. Gidea и Katz (2018) продемонстрировали топологические ранние предупреждения на финансовых данных. Первое крупное коммерческое применение TDA к time series - работа Ayasdi с sensor data промышленного оборудования. Сегодня TDA для time series - стандартный инструмент в риск-менеджменте и медицинской диагностике.

Теорема Такенса о вложении

19 октября 1987 года. Dow Jones упал на 22.6% за один день - крупнейшее однодневное падение в истории. 2008 год, Lehman Brothers. В обоих случаях исследователи позже обнаружили, что топологическая сложность корреляционных сетей рынка резко упала ДО обвала. Особенности слились, петли исчезли - топология рынка стала проще, когда обвал приближался. Инструмент, который позволяет это увидеть - Takens embedding, превращающий одномерный временной ряд в облако точек высокой размерности.

Теорема Такенса (1981): для типичных гладких динамических систем delay-вложение размерности d >= 2*dim(attractor) + 1 сохраняет диффеоморфный образ аттрактора. Топология аттрактора восстанавливается из единственного скалярного измерения.

Выбор параметров delay и dimension

Стандартные эвристики из практики нелинейной динамики

Delay tau: первый минимум функции взаимной информации I(x(t); x(t-tau)). Эта эвристика балансирует независимость координат и сохранение динамики. Embedding dimension d: метод false nearest neighbors - наращиваем d, пока соседи в R^d остаются соседями в R^(d+1). Когда фракция ложных соседей падает до нуля, найдена правильная размерность.

Один сенсор измеряет одну величину - например, ЭКГ. Но динамика сердца многомерна (камера сердца, клапаны, нервная система). Takens embedding позволяет восстановить эту многомерную динамику из единственного канала измерения.

ML применения: классификация ЭКГ через топологические признаки delay-вложения; обнаружение аритмии через анализ петель в H_1 эмбеддинга; индустриальный мониторинг вибрации - конкретный паттерн в топологии delay-вложения предсказывает поломку подшипника за часы до неё.

Что гарантирует теорема Такенса?

Теорема Такенса (1981) даёт топологическое восстановление аттрактора из скалярного измерения при условии d >= 2*dim(attractor)+1.

Sliding window persistence

Применим Takens embedding к скользящему окну длины L в момент t: W_t = {v_s : t <= s <= t+L}. Для каждого окна вычислим Vietoris-Rips persistence (обычно H_1 наиболее информативен). Отслеживаем, как persistence диаграммы меняются во времени. Ключевое наблюдение: для периодических сигналов sliding window генерирует окружность в embedding space, и H_1 содержит одну долгоживущую особенность.

Perea и Harer (2015) доказали теоретические гарантии: для приближённо периодических сигналов длинная bar в H_1 persistence sliding window соответствует периодичности, и её длина связана с амплитудой периодической компоненты.

Persistent entropy

Скалярная мера сложности персистентной диаграммы

Дана persistence диаграмма D с барами длин l_1, ..., l_n. Нормализуем: p_i = l_i / sum(l_j). Persistent entropy: PE = -sum(p_i * log(p_i)). Низкая энтропия = одна доминирующая особенность (простая топология). Высокая энтропия = много сравнимых по длине bars (сложная топология). Эта скалярная статистика годится как признак для LSTM или Random Forest.

L должно быть не меньше периода интересующей динамики, но достаточно мало, чтобы захватывать локальные изменения. Стандарт: L равно 1-3 периодам доминирующей частоты сигнала.

Sliding window работает там, где сигнал нестационарен - именно это делает его полезным. Стандартные методы (FFT, ARIMA) требуют стационарности или её приближения. Sliding window TDA отслеживает топологию локально.

ML применения: sliding window persistent entropy как признак для LSTM в задачах time series classification; замена или дополнение к традиционным признакам (autocorrelation, STL decomposition) топологическими статистиками; обнаружение аномалий в multivariate sensor data через сравнение persistent diagrams соседних окон.

Что генерирует sliding window для периодического сигнала?

Периодичность проявляется как окружность в delay-вложении, и H_1 содержит одну bar длинной жизни.

Ранние предупреждения о критических переходах

Вблизи бифуркации (точки невозврата) динамические системы замедляются - восстановление от возмущений занимает дольше. Это проявляется как critical slowing down: автокорреляция стремится к 1, дисперсия растёт. TDA добавляет ещё одно измерение раннего предупреждения - топология аттрактора меняется по мере приближения к tipping point. Метрика: persistent entropy sliding windows со временем.

Gidea и Katz (2018) показали топологические ранние предупреждения для финансового кризиса 2007-2008: persistent entropy SP500 корреляций упала за несколько месяцев до коллапса. Топология рынка стала проще, что в ретроспективе сигнализировало о потере устойчивости.

Чёрный понедельник 1987

Топологическая динамика до и после обвала

За месяц до 19 октября 1987: persistent entropy корреляционной сети SP500 устойчиво снижается. Особенности (H_0 кластеры, H_1 циклы корреляций) сливаются - рынок становится топологически проще, эффективно одномерным. После обвала: persistent entropy резко возрастает - топология фрагментируется в хаос. Этот паттерн повторился в 2000 (dot-com), 2008 (Lehman), 2020 (COVID).

В risk management hedge funds: sliding window persistent entropy всех корреляционных пар инструментов отслеживается в реальном времени. Падение энтропии ниже исторического порога триггерит снижение leverage и пересмотр положений.

Persistent entropy - один из сигналов раннего предупреждения, но не серебряная пуля. Лучшие подходы комбинируют critical slowing down (вариация, автокорреляция), TDA метрики (entropy, longest bar) и доменные индикаторы (VIX, спреды). False positives неизбежны - топология может меняться по доброкачественным причинам.

Другие применения: экологические tipping points (эвтрофикация озёр - топология сети взаимодействий видов упрощается перед коллапсом экосистемы); климатические tipping points (Berwald и Gidea 2014 на El Nino паттернах); мониторинг здоровья ML моделей в production - топология выходного распределения меняется при concept drift, prerequisite для retraining.

Что происходит с persistent entropy при приближении к tipping point?

Critical slowing down проявляется и в топологии: система теряет разнообразие конфигураций перед бифуркацией.

Применения: ЭКГ, рынки, климат

Анализ ЭКГ: фибрилляция предсердий порождает характерные топологические паттерны в Takens-вложении - возникают петли, отсутствующие в нормальном ритме. Pereira и de Mello (2015) опубликовали классификацию аритмии с TDA признаками; точность 92-95% на стандартных датасетах (MIT-BIH Arrhythmia).

Sliding window TDA на ЭКГ имеет физиологическую интерпретацию: H_1 bars измеряют регулярность сердечного цикла, число H_0 компонентов - ритмическую вариабельность. Аритмии нарушают обе характеристики предсказуемыми способами.

Финансовая катастрофа 2008

Gidea-Katz, Topological Data Analysis of Financial Time Series

Метод: ежедневные доходности SP500 за 100 дней, sliding window delay-embedding, H_0 и H_1 persistence через VR. Метрика: L1, L2 нормы persistence diagrams во времени. Результат: норма резко возрастает в августе 2008, за месяц до банкротства Lehman Brothers. Тот же паттерн виден перед dot-com (2000), азиатским кризисом (1997), 1987 - валидация на ретроспективе четырёх обвалов.

Современный фронт: time series transformers + TDA признаки. TDA даёт глобальные топологические инварианты, transformer обрабатывает локальные паттерны через self-attention. Гибрид превосходит чисто-нейросетевые подходы на задачах классификации time series, особенно когда обучающих данных мало.

Климат: Berwald и Gidea (2014) применили sliding window TDA к температурным рядам Тихого океана для анализа El Nino циклов. Топологические признаки выявили decade-scale изменения в стабильности циклов. Индустрия: Ayasdi (одна из первых TDA компаний) применила метод к sensor data промышленного оборудования - предсказание поломок турбин и насосов за дни до отказа.

Tuning гиперпараметров (tau, d, L) остаётся ручным процессом - нет универсальных эвристик для всех задач. Differentiable TDA (обучаемые параметры фильтрации через градиентный спуск) - активная область research, но computationally дорого.

Как ML гибрид TDA с нейросетями превосходит каждый по отдельности?

TDA и нейросети дополняют друг друга: топология даёт robustness и интерпретируемость, нейросеть - flexibility и точность.

Куда это ведёт

Sliding window TDA соединяет дифференциальную геометрию (Takens) с computational topology (persistence) и приложениями в финансах, медицине и климатологии. Это одно из самых мощных применений топологии за пределами чистой математики.

TDA в нейросетях — Связанная тема
Witness complexes — Связанная тема
Persistent homology — Связанная тема
Vietoris-Rips и Cech — Связанная тема

Ключевые идеи

Takens embedding превращает скалярный сигнал в d-мерное облако точек через delay-векторы
При d >= 2*dim(attractor)+1 топология аттрактора сохраняется (теорема Такенса 1981)
Параметры tau и d выбирают через mutual information и false nearest neighbors
Sliding window persistence отслеживает топологию локально по времени
Periodic signals дают окружность в embedding с долгой H_1 bar
Persistent entropy - скалярная мера сложности диаграммы, полезна как ML признак
Critical slowing down имеет топологический аналог: упрощение топологии перед tipping point
Применения: ЭКГ классификация, financial crash prediction, climate tipping points

Вопросы для размышления

Почему теорема Такенса требует d >= 2*dim(attractor)+1, а не просто dim(attractor)?
Какие свойства финансовых данных делают TDA подходящим инструментом, в отличие от классической эконометрики?
Как выбор размера окна L влияет на чувствительность к разным временным масштабам?
В каких задачах persistent entropy предпочтительнее, чем полная persistence diagram?
Как обучить параметры delay embedding градиентным спуском без потери теоретических гарантий?

Связанные уроки

top-32 — Persistence нужна для sliding window анализа
top-35 — Witness complexes масштабируют sliding window TDA
top-37 — Активации нейросети - тоже time series для TDA
prob-18-poisson