Causal Calculus
Структурные причинные модели (SCM)
FDA одобряет препараты на основе рандомизированных контролируемых испытаний. Но что делать, когда рандомизация невозможна - курение, хирургические операции, политические вмешательства? Структурные причинные модели дают математический язык для оценки причинных эффектов по наблюдательным данным.
- Медицина: оценка эффекта лечения без рандомизации через критерий бэкдора
- Эпидемиология: структура конфаундера в исследованиях курения и рака
- Реклама: причинный эффект показа объявления на конверсию (vs корреляция)
- Политика: оценка эффекта образовательных программ при самоотборе участников
- Технологии: A/B тестирование нарушено при интерференции между пользователями
Цели урока
- Строить структурные причинные модели (SCM) в виде DAG и записывать структурные уравнения
- Применять правила do-исчисления Перла для идентификации причинных эффектов
- Использовать критерии бэкдора и фронтдура для выбора корректного набора переменных контроля
Предварительные знания
- Условная вероятность и теорема Байеса
- Направленные ациклические графы (DAG): d-разделённость
- Основы статистики: выборочное среднее, регрессия
Структурные причинные модели
SCM задаёт для каждой переменной $X_i$ структурное уравнение $X_i = f_i(\mathrm{Pa}_i, U_i)$, где $\mathrm{Pa}_i$ - родители в DAG, $U_i$ - экзогенный шум. DAG кодирует причинную структуру: стрелка $X \to Y$ означает, что $X$ является причиной $Y$. Это принципиально отличается от корреляции.
Do-исчисление и идентификация
Оператор $\mathrm{do}(X=x)$ моделирует вмешательство: удаление всех входящих стрелок в $X$ в DAG. $P(Y|\mathrm{do}(X=x)) \neq P(Y|X=x)$ в присутствии конфаундеров. Do-исчисление - три правила вывода, доказанных Перлом, достаточных для идентификации любого идентифицируемого причинного эффекта.
Структурные уравнения и SCM
Google DeepMind использует SCM для drug discovery - различение корреляции и причинности сократило число провалов в фазе II клинических испытаний на 40%. Структурная причинная модель задаёт механизм порождения данных: каждая переменная - функция своих причин и шума.
В наблюдательных данных E[Y|X=x] смешивает причинный эффект X→Y с backdoor-путём X←Z→Y. Только do(X=x) изолирует прямой причинный вклад.
Что означает оператор do(X=x) в SCM?
do(X=x) моделирует физическое вмешательство: X принудительно устанавливается в x, его структурные причины (входящие стрелки) удаляются из DAG.
Do-calculus и backdoor-критерий
Три правила do-calculus Перля - полная система для вывода интервенционных распределений из наблюдательных данных. Backdoor-критерий даёт практический рецепт: найти множество Z, блокирующее все backdoor-пути из X в Y.
Backdoor adjustment работает только если adjustment set наблюдаем. Когда конфаундер скрыт - нужен frontdoor criterion или инструментальные переменные.
Когда backdoor adjustment валиден?
Два условия: Z блокирует все backdoor-пути (нет открытых путей через конфаундеры) и Z не является потомком X (иначе блокируем часть причинного эффекта).
Идентифицируемость причинных эффектов
Причинный эффект идентифицируем, если его можно выразить через наблюдательное распределение P(V). Когда backdoor-множество не существует - frontdoor criterion предлагает обходной путь через медиатор.
Не все DAG идентифицируемы. Алгоритм ID Shpitser & Pearl (2006) является полным: если он не может вывести P(Y|do(X)), то эффект принципиально неидентифицируем из данных.
В каком случае frontdoor criterion применим вместо backdoor?
Frontdoor criterion работает при скрытом конфаундере, если медиатор M: (1) перехватывает все directed пути X→Y, (2) нет незаблокированных backdoor-путей X→M, (3) все backdoor-пути M→Y блокируются X.
Конфаундер: курение, смола, рак
DAG: $Z$ (курение) $\to X$ (смола в лёгких) $\to Y$ (рак), $Z \to Y$. Наблюдаемая корреляция $X \sim Y$ включает путь через конфаундер $Z$. Критерий бэкдура: контроль $Z$ блокирует все бэкдур-пути к $X$, и $P(Y|\mathrm{do}(X)) = \sum_z P(Y|X,Z)P(Z)$.
Критерий фронтдура
Если прямое вмешательство невозможно (скрытый конфаундер $U$: $X \leftarrow U \rightarrow Y$), но есть медиатор $M$: $X \to M \to Y$ без бэкдур-пути через $U$ к $M$, то $P(Y|\mathrm{do}(X)) = \sum_m P(M=m|X)\sum_x P(Y|X=x, M=m)P(X=x)$.
Итоги
- SCM = DAG + структурные уравнения $X_i = f_i(\mathrm{Pa}_i, U_i)$; стрелки кодируют причинность, а не корреляцию
- Do-оператор $\mathrm{do}(X=x)$ моделирует вмешательство: удаление входящих стрелок в $X$
- Критерий бэкдора и фронтдура - алгоритмические условия идентификации $P(Y|\mathrm{do}(X))$ из наблюдательных данных
Связь с другими темами
Do-исчисление обобщается на контрфактуальный анализ через трёхшаговую процедуру: abduction (обновить $U$ под наблюдение), action ($\mathrm{do}$), prediction (вычислить $Y$ в новой модели). Это позволяет отвечать на вопросы типа 'что было бы, если бы...' на уровне отдельных субъектов.
- Связанные темы — развивает
Вопросы для размышления
- Почему $P(Y|X=x) \neq P(Y|\mathrm{do}(X=x))$? Приведите пример, где они совпадают и где расходятся.
- D-разделённость в DAG определяет условную независимость. Как это связано с критерием бэкдура?
- Можно ли идентифицировать причинный эффект в DAG со скрытыми конфаундерами? При каких условиях?