Causal Calculus

Frontdoor criterion: причинный эффект без рандомизации

Рандомизированный эксперимент невозможен - этически, юридически, практически. Нельзя случайно назначить людям курить. Нельзя рандомизировать детство в бедности. Нельзя провести RCT для изучения эффекта климатической политики. Наблюдательные данные - всё, что есть. И backdoor-критерий не работает, потому что конфаундер ненаблюдаем. Перль в 1995 показал: в этом случае есть другой путь - буквально.

**Эпидемиология**: оценка вреда курения без RCT - классическое применение frontdoor по Перлю. Все современные epidemiological studies на observational data используют эту логику
**Causal ML**: IRM (Invariant Risk Minimization, Arjovsky 2019) и другие causal representation learning методы неявно используют frontdoor-рассуждения для out-of-distribution generalization
**COVID исследования**: оценка эффекта вакцинации через иммунный ответ как медиатор - когда прямые observational данные конфаундированы сотнями ненаблюдаемых факторов
**Политика и экономика**: оценка эффекта образовательных программ через механизм (навыки) а не напрямую - когда отбор в программу ненаблюдаемо коррелирует с результатом

Предварительные знания

Backdoor Criterion

Идея: обойти ненаблюдаемый конфаундер

Рандомизированный эксперимент для проверки вреда курения невозможен: нельзя случайно назначить людям курить. Наблюдательные данные дают корреляцию курение - рак. Но существует ненаблюдаемый ген $U$, который влияет и на склонность к курению, и на риск рака - классический скрытый конфаундер.

Backdoor-критерий требует заблокировать все backdoor-пути от $X$ к $Y$. Путь $X \leftarrow U \rightarrow Y$ - backdoor. Но $U$ ненаблюдаем. Значит backdoor-критерий неприменим. Казалось бы - тупик.

**Ключевая идея frontdoor**: вместо того чтобы блокировать backdoor через $U$, используем медиатор $M$ (смолы в лёгких) как промежуточную станцию. Каузальный эффект $X \to Y$ раскладывается в два идентифицируемых шага: $X \to M$ (без конфаундера) и $M \to Y$ (с backdoor-корректировкой по $X$).

1995 год. Джудеа Перль публикует 'Causal inference in statistics: An overview'. Frontdoor criterion - один из трёх результатов этой статьи. В 2011 году Перль получает премию Тьюринга. Жюри отмечает именно do-calculus и criteria как вклад в 'причинность сложнее нейросетей'.

Почему backdoor-критерий неприменим к DAG: Smoking <- U -> Cancer, если U ненаблюдаем?

Критерий frontdoor и формула идентификации

Множество переменных $M$ удовлетворяет **frontdoor criterion** относительно $(X, Y)$ в DAG $G$, если выполнены три условия:

**Перехват**: $M$ перехватывает все directed пути от $X$ к $Y$ (все пути $X \to \ldots \to Y$ проходят через $M$)
**Нет backdoor из X в M**: не существует unblocked backdoor-пути от $X$ к $M$ (в $G$ нет ненаблюдаемого конфаундера между $X$ и $M$)
**Backdoor из M в Y блокируется через X**: все backdoor-пути от $M$ к $Y$ блокируются при условии на $X$

Если $M$ удовлетворяет frontdoor criterion, то причинный эффект $P(Y \mid do(X))$ идентифицируется через observational distribution:

Три слагаемых - три шага do-calculus, спрятанных за одной формулой:

Шаг	Что считаем	Смысл
$P(M = m \mid X = x)$	Из наблюдений	Эффект X на M - нет backdoor, observational = causal
$P(Y = y \mid X = x', M = m)$	Из наблюдений	Условный эффект M на Y при фиксированном X
$\sum_{x'} \ldots P(X = x')$	Маргинализация по X	Backdoor-корректировка: усредняем по X чтобы убрать U -> Y

**Интуиция формулы**: сначала считаем как X меняет M (шаг 1, без конфаундера). Потом считаем как M меняет Y при нейтрализованном U (шаг 2 + маргинализация по X). Два independenly identifiable куска дают один causal answer.

Какое из условий frontdoor criterion гарантирует, что $P(M \mid X)$ observational равно $P(M \mid do(X))$ causal?

Пример: курение - смолы - рак (Pearl)

Классический пример Перля: $X$ = курение, $M$ = содержание смол в лёгких, $Y$ = рак, $U$ = ненаблюдаемый генетический фактор.

Формула для конкретного примера (дискретные переменные):

Все три компонента оцениваются из observational data - никакого эксперимента. Это то, что делает эпидемиологов с observational studies: когда RCT невозможен по этическим или практическим причинам, frontdoor criterion (при соблюдении условий) даёт causal estimate.

**COVID-приложение**: оценка эффекта вакцинации на тяжёлые исходы в observational данных. Прямой backdoor невозможен (множество ненаблюдаемых конфаундеров - сопутствующие заболевания, социально-экономический статус). Frontdoor через иммунный ответ ($M$ = уровень антител) - один из подходов в causal ML для таких задач.

Frontdoor criterion применим всегда когда есть медиатор

Frontdoor требует трёх строгих структурных условий на DAG

Медиатор $M$ сам по себе не решает проблему конфаундинга. Если между $X$ и $M$ есть ненаблюдаемый конфаундер (условие 2 нарушено) - первый шаг формулы уже не идентифицируем. Или если backdoor от $M$ к $Y$ нельзя заблокировать через $X$ (условие 3) - второй шаг ломается. Frontdoor - точный хирургический инструмент, не общая палочка-выручалочка.

В примере курение-смолы-рак: какой путь создаёт backdoor от M (смолы) к Y (рак), и почему условие на X его блокирует?

Ключевые идеи

**Frontdoor criterion** - инструмент для случая когда backdoor-критерий неприменим из-за ненаблюдаемого конфаундера
**Три условия**: M перехватывает все пути X->Y, нет backdoor X->M, backdoor M->Y блокируется через X
**Формула идентификации**: $P(Y \mid do(X)) = \sum_m P(m \mid X) \sum_{x'} P(Y \mid x', m) P(x')$ - только observational данные
**Два шага**: сначала идентифицируем X->M (без конфаундера), потом M->Y (backdoor-корректировка по X)
**Курение-смолы-рак**: классический пример Перля где U (ген) ненаблюдаем, но M (смолы) наблюдаем
**Ограничения**: frontdoor - точный инструмент с жёсткими структурными требованиями, не универсальное решение

Связанные темы

Frontdoor - частный случай более общего фреймворка do-calculus:

Do-calculus (три правила Перля) — Do-calculus - общая система вывода, из которой frontdoor criterion следует как теорема
Идентифицируемость — Когда ни frontdoor ни backdoor не работают - общая теория идентифицируемости через do-calculus
Mediation analysis — Frontdoor как инструмент анализа прямых и косвенных эффектов через медиатор

Вопросы для размышления

Если в DAG есть два медиатора $M_1$ и $M_2$ между $X$ и $Y$, и ненаблюдаемый конфаундер $U$ влияет только на $M_2$ - можно ли применить frontdoor через $\{M_1, M_2\}$? Через $\{M_1\}$ только?
COVID: врачи хотят оценить эффект вакцинации ($X$) на смертность ($Y$). Иммунный ответ ($M$) - наблюдаем. Ненаблюдаемые сопутствующие заболевания - конфаундеры. Проверьте три условия frontdoor для $M$ в этом сценарии.
Frontdoor criterion - это частный случай do-calculus с тремя правилами. Какие из трёх правил применяются в каждом шаге вывода формулы?

Связанные уроки

cc-03-backdoor — Frontdoor строится там, где backdoor не работает - нужен контраст
cc-06-do-calculus — Do-calculus - общий фреймворк, frontdoor - его частный случай
cc-07-identifiability — Идентифицируемость: когда frontdoor и backdoor оба не работают
prob-03-conditional — Вся формула frontdoor - это маргинализация условных вероятностей
cc-08-mediation — Mediation analysis: frontdoor как инструмент анализа прямых и косвенных эффектов
stat-01-sampling