Causal Calculus

Структурные причинные модели (SCM)

FDA одобряет препараты на основе рандомизированных контролируемых испытаний. Но что делать, когда рандомизация невозможна - курение, хирургические операции, политические вмешательства? Структурные причинные модели дают математический язык для оценки причинных эффектов по наблюдательным данным.

Медицина: оценка эффекта лечения без рандомизации через критерий бэкдора
Эпидемиология: структура конфаундера в исследованиях курения и рака
Реклама: причинный эффект показа объявления на конверсию (vs корреляция)
Политика: оценка эффекта образовательных программ при самоотборе участников
Технологии: A/B тестирование нарушено при интерференции между пользователями

Цели урока

Строить структурные причинные модели (SCM) в виде DAG и записывать структурные уравнения
Применять правила do-исчисления Перла для идентификации причинных эффектов
Использовать критерии бэкдора и фронтдура для выбора корректного набора переменных контроля

Предварительные знания

Условная вероятность и теорема Байеса
Направленные ациклические графы (DAG): d-разделённость
Основы статистики: выборочное среднее, регрессия

Структурные причинные модели

SCM задаёт для каждой переменной $X_i$ структурное уравнение $X_i = f_i(\mathrm{Pa}_i, U_i)$, где $\mathrm{Pa}_i$ - родители в DAG, $U_i$ - экзогенный шум. DAG кодирует причинную структуру: стрелка $X \to Y$ означает, что $X$ является причиной $Y$. Это принципиально отличается от корреляции.

Do-исчисление и идентификация

Оператор $\mathrm{do}(X=x)$ моделирует вмешательство: удаление всех входящих стрелок в $X$ в DAG. $P(Y|\mathrm{do}(X=x)) \neq P(Y|X=x)$ в присутствии конфаундеров. Do-исчисление - три правила вывода, доказанных Перлом, достаточных для идентификации любого идентифицируемого причинного эффекта.

Структурные уравнения и SCM

Google DeepMind использует SCM для drug discovery - различение корреляции и причинности сократило число провалов в фазе II клинических испытаний на 40%. Структурная причинная модель задаёт механизм порождения данных: каждая переменная - функция своих причин и шума.

В наблюдательных данных E[Y|X=x] смешивает причинный эффект X→Y с backdoor-путём X←Z→Y. Только do(X=x) изолирует прямой причинный вклад.

Что означает оператор do(X=x) в SCM?

do(X=x) моделирует физическое вмешательство: X принудительно устанавливается в x, его структурные причины (входящие стрелки) удаляются из DAG.

Do-calculus и backdoor-критерий

Три правила do-calculus Перля - полная система для вывода интервенционных распределений из наблюдательных данных. Backdoor-критерий даёт практический рецепт: найти множество Z, блокирующее все backdoor-пути из X в Y.

Backdoor adjustment работает только если adjustment set наблюдаем. Когда конфаундер скрыт - нужен frontdoor criterion или инструментальные переменные.

Когда backdoor adjustment валиден?

Два условия: Z блокирует все backdoor-пути (нет открытых путей через конфаундеры) и Z не является потомком X (иначе блокируем часть причинного эффекта).

Идентифицируемость причинных эффектов

Причинный эффект идентифицируем, если его можно выразить через наблюдательное распределение P(V). Когда backdoor-множество не существует - frontdoor criterion предлагает обходной путь через медиатор.

Не все DAG идентифицируемы. Алгоритм ID Shpitser & Pearl (2006) является полным: если он не может вывести P(Y|do(X)), то эффект принципиально неидентифицируем из данных.

В каком случае frontdoor criterion применим вместо backdoor?

Frontdoor criterion работает при скрытом конфаундере, если медиатор M: (1) перехватывает все directed пути X→Y, (2) нет незаблокированных backdoor-путей X→M, (3) все backdoor-пути M→Y блокируются X.

Конфаундер: курение, смола, рак

DAG: $Z$ (курение) $\to X$ (смола в лёгких) $\to Y$ (рак), $Z \to Y$. Наблюдаемая корреляция $X \sim Y$ включает путь через конфаундер $Z$. Критерий бэкдура: контроль $Z$ блокирует все бэкдур-пути к $X$, и $P(Y|\mathrm{do}(X)) = \sum_z P(Y|X,Z)P(Z)$.

Критерий фронтдура

Если прямое вмешательство невозможно (скрытый конфаундер $U$: $X \leftarrow U \rightarrow Y$), но есть медиатор $M$: $X \to M \to Y$ без бэкдур-пути через $U$ к $M$, то $P(Y|\mathrm{do}(X)) = \sum_m P(M=m|X)\sum_x P(Y|X=x, M=m)P(X=x)$.

Итоги

SCM = DAG + структурные уравнения $X_i = f_i(\mathrm{Pa}_i, U_i)$; стрелки кодируют причинность, а не корреляцию
Do-оператор $\mathrm{do}(X=x)$ моделирует вмешательство: удаление входящих стрелок в $X$
Критерий бэкдора и фронтдура - алгоритмические условия идентификации $P(Y|\mathrm{do}(X))$ из наблюдательных данных

Связь с другими темами

Do-исчисление обобщается на контрфактуальный анализ через трёхшаговую процедуру: abduction (обновить $U$ под наблюдение), action ($\mathrm{do}$), prediction (вычислить $Y$ в новой модели). Это позволяет отвечать на вопросы типа 'что было бы, если бы...' на уровне отдельных субъектов.

Связанные темы — развивает

Вопросы для размышления

Почему $P(Y|X=x) \neq P(Y|\mathrm{do}(X=x))$? Приведите пример, где они совпадают и где расходятся.
D-разделённость в DAG определяет условную независимость. Как это связано с критерием бэкдура?
Можно ли идентифицировать причинный эффект в DAG со скрытыми конфаундерами? При каких условиях?