Топология
TDA для time series: Takens embedding и финансовые катастрофы
Цели урока
- Понять теорему Такенса и delay-вложение скалярных рядов
- Освоить sliding window TDA для нестационарных сигналов
- Изучить persistent entropy как скалярную меру топологической сложности
- Узнать о топологических ранних предупреждениях критических переходов
- Разобрать применения к ЭКГ, финансовым рынкам и климату
Предварительные знания
- Persistent homology и Vietoris-Rips комплекс
- Основы динамических систем (аттракторы, бифуркации)
- Линейная алгебра над полем
- Базовые понятия теории вероятностей (автокорреляция, дисперсия)
1987. Чёрный понедельник. Dow Jones -22.6%. Топология рынка упростилась за месяц до этого. TDA увидела сигнал, который никто не услышал.
- **Cardiology**: классификация аритмий через TDA признаки ЭКГ (Pereira & de Mello 2015)
- **Finance**: ранние предупреждения о рыночных обвалах через persistent entropy (Gidea & Katz 2018)
- **Climate science**: анализ El Nino циклов через sliding window TDA (Berwald & Gidea 2014)
- **Industrial IoT**: предсказание поломок оборудования через топологию sensor data (Ayasdi)
От Такенса до topological time series
Флорис Такенс доказал свою теорему о вложении в 1981 году в статье Detecting Strange Attractors in Turbulence - landmark paper теории динамических систем. Связь с TDA сделана много позже: Perea и Harer (2015) установили теоретические гарантии persistence sliding windows для периодических сигналов. Gidea и Katz (2018) продемонстрировали топологические ранние предупреждения на финансовых данных. Первое крупное коммерческое применение TDA к time series - работа Ayasdi с sensor data промышленного оборудования. Сегодня TDA для time series - стандартный инструмент в риск-менеджменте и медицинской диагностике.
Теорема Такенса о вложении
19 октября 1987 года. Dow Jones упал на 22.6% за один день - крупнейшее однодневное падение в истории. 2008 год, Lehman Brothers. В обоих случаях исследователи позже обнаружили, что топологическая сложность корреляционных сетей рынка резко упала ДО обвала. Особенности слились, петли исчезли - топология рынка стала проще, когда обвал приближался. Инструмент, который позволяет это увидеть - Takens embedding, превращающий одномерный временной ряд в облако точек высокой размерности.
Теорема Такенса (1981): для типичных гладких динамических систем delay-вложение размерности d >= 2*dim(attractor) + 1 сохраняет диффеоморфный образ аттрактора. Топология аттрактора восстанавливается из единственного скалярного измерения.
Выбор параметров delay и dimension
Стандартные эвристики из практики нелинейной динамики
Delay tau: первый минимум функции взаимной информации I(x(t); x(t-tau)). Эта эвристика балансирует независимость координат и сохранение динамики. Embedding dimension d: метод false nearest neighbors - наращиваем d, пока соседи в R^d остаются соседями в R^(d+1). Когда фракция ложных соседей падает до нуля, найдена правильная размерность.
Один сенсор измеряет одну величину - например, ЭКГ. Но динамика сердца многомерна (камера сердца, клапаны, нервная система). Takens embedding позволяет восстановить эту многомерную динамику из единственного канала измерения.
ML применения: классификация ЭКГ через топологические признаки delay-вложения; обнаружение аритмии через анализ петель в H_1 эмбеддинга; индустриальный мониторинг вибрации - конкретный паттерн в топологии delay-вложения предсказывает поломку подшипника за часы до неё.
Что гарантирует теорема Такенса?
Теорема Такенса (1981) даёт топологическое восстановление аттрактора из скалярного измерения при условии d >= 2*dim(attractor)+1.
Sliding window persistence
Применим Takens embedding к скользящему окну длины L в момент t: W_t = {v_s : t <= s <= t+L}. Для каждого окна вычислим Vietoris-Rips persistence (обычно H_1 наиболее информативен). Отслеживаем, как persistence диаграммы меняются во времени. Ключевое наблюдение: для периодических сигналов sliding window генерирует окружность в embedding space, и H_1 содержит одну долгоживущую особенность.
Perea и Harer (2015) доказали теоретические гарантии: для приближённо периодических сигналов длинная bar в H_1 persistence sliding window соответствует периодичности, и её длина связана с амплитудой периодической компоненты.
Persistent entropy
Скалярная мера сложности персистентной диаграммы
Дана persistence диаграмма D с барами длин l_1, ..., l_n. Нормализуем: p_i = l_i / sum(l_j). Persistent entropy: PE = -sum(p_i * log(p_i)). Низкая энтропия = одна доминирующая особенность (простая топология). Высокая энтропия = много сравнимых по длине bars (сложная топология). Эта скалярная статистика годится как признак для LSTM или Random Forest.
L должно быть не меньше периода интересующей динамики, но достаточно мало, чтобы захватывать локальные изменения. Стандарт: L равно 1-3 периодам доминирующей частоты сигнала.
Sliding window работает там, где сигнал нестационарен - именно это делает его полезным. Стандартные методы (FFT, ARIMA) требуют стационарности или её приближения. Sliding window TDA отслеживает топологию локально.
ML применения: sliding window persistent entropy как признак для LSTM в задачах time series classification; замена или дополнение к традиционным признакам (autocorrelation, STL decomposition) топологическими статистиками; обнаружение аномалий в multivariate sensor data через сравнение persistent diagrams соседних окон.
Что генерирует sliding window для периодического сигнала?
Периодичность проявляется как окружность в delay-вложении, и H_1 содержит одну bar длинной жизни.
Ранние предупреждения о критических переходах
Вблизи бифуркации (точки невозврата) динамические системы замедляются - восстановление от возмущений занимает дольше. Это проявляется как critical slowing down: автокорреляция стремится к 1, дисперсия растёт. TDA добавляет ещё одно измерение раннего предупреждения - топология аттрактора меняется по мере приближения к tipping point. Метрика: persistent entropy sliding windows со временем.
Gidea и Katz (2018) показали топологические ранние предупреждения для финансового кризиса 2007-2008: persistent entropy SP500 корреляций упала за несколько месяцев до коллапса. Топология рынка стала проще, что в ретроспективе сигнализировало о потере устойчивости.
Чёрный понедельник 1987
Топологическая динамика до и после обвала
За месяц до 19 октября 1987: persistent entropy корреляционной сети SP500 устойчиво снижается. Особенности (H_0 кластеры, H_1 циклы корреляций) сливаются - рынок становится топологически проще, эффективно одномерным. После обвала: persistent entropy резко возрастает - топология фрагментируется в хаос. Этот паттерн повторился в 2000 (dot-com), 2008 (Lehman), 2020 (COVID).
В risk management hedge funds: sliding window persistent entropy всех корреляционных пар инструментов отслеживается в реальном времени. Падение энтропии ниже исторического порога триггерит снижение leverage и пересмотр положений.
Persistent entropy - один из сигналов раннего предупреждения, но не серебряная пуля. Лучшие подходы комбинируют critical slowing down (вариация, автокорреляция), TDA метрики (entropy, longest bar) и доменные индикаторы (VIX, спреды). False positives неизбежны - топология может меняться по доброкачественным причинам.
Другие применения: экологические tipping points (эвтрофикация озёр - топология сети взаимодействий видов упрощается перед коллапсом экосистемы); климатические tipping points (Berwald и Gidea 2014 на El Nino паттернах); мониторинг здоровья ML моделей в production - топология выходного распределения меняется при concept drift, prerequisite для retraining.
Что происходит с persistent entropy при приближении к tipping point?
Critical slowing down проявляется и в топологии: система теряет разнообразие конфигураций перед бифуркацией.
Применения: ЭКГ, рынки, климат
Анализ ЭКГ: фибрилляция предсердий порождает характерные топологические паттерны в Takens-вложении - возникают петли, отсутствующие в нормальном ритме. Pereira и de Mello (2015) опубликовали классификацию аритмии с TDA признаками; точность 92-95% на стандартных датасетах (MIT-BIH Arrhythmia).
Sliding window TDA на ЭКГ имеет физиологическую интерпретацию: H_1 bars измеряют регулярность сердечного цикла, число H_0 компонентов - ритмическую вариабельность. Аритмии нарушают обе характеристики предсказуемыми способами.
Финансовая катастрофа 2008
Gidea-Katz, Topological Data Analysis of Financial Time Series
Метод: ежедневные доходности SP500 за 100 дней, sliding window delay-embedding, H_0 и H_1 persistence через VR. Метрика: L1, L2 нормы persistence diagrams во времени. Результат: норма резко возрастает в августе 2008, за месяц до банкротства Lehman Brothers. Тот же паттерн виден перед dot-com (2000), азиатским кризисом (1997), 1987 - валидация на ретроспективе четырёх обвалов.
Современный фронт: time series transformers + TDA признаки. TDA даёт глобальные топологические инварианты, transformer обрабатывает локальные паттерны через self-attention. Гибрид превосходит чисто-нейросетевые подходы на задачах классификации time series, особенно когда обучающих данных мало.
Климат: Berwald и Gidea (2014) применили sliding window TDA к температурным рядам Тихого океана для анализа El Nino циклов. Топологические признаки выявили decade-scale изменения в стабильности циклов. Индустрия: Ayasdi (одна из первых TDA компаний) применила метод к sensor data промышленного оборудования - предсказание поломок турбин и насосов за дни до отказа.
Tuning гиперпараметров (tau, d, L) остаётся ручным процессом - нет универсальных эвристик для всех задач. Differentiable TDA (обучаемые параметры фильтрации через градиентный спуск) - активная область research, но computationally дорого.
Как ML гибрид TDA с нейросетями превосходит каждый по отдельности?
TDA и нейросети дополняют друг друга: топология даёт robustness и интерпретируемость, нейросеть - flexibility и точность.
Куда это ведёт
Sliding window TDA соединяет дифференциальную геометрию (Takens) с computational topology (persistence) и приложениями в финансах, медицине и климатологии. Это одно из самых мощных применений топологии за пределами чистой математики.
- TDA в нейросетях — Связанная тема
- Witness complexes — Связанная тема
- Persistent homology — Связанная тема
- Vietoris-Rips и Cech — Связанная тема
Ключевые идеи
- Takens embedding превращает скалярный сигнал в d-мерное облако точек через delay-векторы
- При d >= 2*dim(attractor)+1 топология аттрактора сохраняется (теорема Такенса 1981)
- Параметры tau и d выбирают через mutual information и false nearest neighbors
- Sliding window persistence отслеживает топологию локально по времени
- Periodic signals дают окружность в embedding с долгой H_1 bar
- Persistent entropy - скалярная мера сложности диаграммы, полезна как ML признак
- Critical slowing down имеет топологический аналог: упрощение топологии перед tipping point
- Применения: ЭКГ классификация, financial crash prediction, climate tipping points
Вопросы для размышления
- Почему теорема Такенса требует d >= 2*dim(attractor)+1, а не просто dim(attractor)?
- Какие свойства финансовых данных делают TDA подходящим инструментом, в отличие от классической эконометрики?
- Как выбор размера окна L влияет на чувствительность к разным временным масштабам?
- В каких задачах persistent entropy предпочтительнее, чем полная persistence diagram?
- Как обучить параметры delay embedding градиентным спуском без потери теоретических гарантий?
Связанные уроки
- top-32 — Persistence нужна для sliding window анализа
- top-35 — Witness complexes масштабируют sliding window TDA
- top-37 — Активации нейросети - тоже time series для TDA
- prob-18-poisson