Causal Calculus
Медиационный анализ
Препарат снижает давление, но через какой механизм - прямо или через почки? Дискриминация при найме: через квалификацию (законно) или напрямую через пол (незаконно)? Медиационный анализ разделяет причинный эффект на прямой и косвенный, что критично для политики, права и интерпретации ML-моделей.
- Медицина: как препарат действует - прямо на орган-мишень или через биомаркер?
- Трудовое право: дискриминация de jure vs de facto через промежуточные переменные
- Социология: эффект образования на зарплату прямой и через тип занятости
- Нейронауки: какие нейронные пути опосредуют когнитивный эффект стимула?
- Объяснимый ИИ: прямой и косвенный вклад признака в предсказание
Цели урока
- Декомпозировать причинный эффект на NDE (прямой) и NIE (косвенный) через формулу медиации
- Применять формулу медиации Перла для нелинейных моделей с взаимодействиями
- Оценивать чувствительность к ненаблюдаемым конфаундерам через параметр $\rho$
Предварительные знания
- Контрфактуальный анализ и потенциальные исходы
- Do-исчисление и критерий бэкдора
- Линейная регрессия и остатки
NDE и NIE: формула медиации
Для $X \to M \to Y$ и $X \to Y$ полный эффект $\tau = NDE + NIE$. Натуральный прямой эффект $NDE = E[Y(x, M(x_0)) - Y(x_0, M(x_0))]$: изменение $Y$ при изменении $X$, если $M$ зафиксирован на уровне $x_0$. Натуральный косвенный эффект $NIE = E[Y(x, M(x)) - Y(x, M(x_0))]$: изменение $Y$ только через изменение $M$.
Чувствительность к ненаблюдаемым конфаундерам
Параметр $\rho$ - корреляция ошибок $\varepsilon_M$ и $\varepsilon_Y$ (ненаблюдаемый конфаундер медиатора). При $\rho=0$ нет конфаундинга. Анализ чувствительности: как меняется NIE при $\rho \neq 0$? Если вывод устойчив при $|\rho| < 0.3$, это приемлемо для большинства приложений.
Классический подход Барона-Кенни (1986) требует линейности, отсутствия взаимодействий и отсутствия конфаундинга медиатора. Формула медиации Перла снимает требование линейности, но конфаундинг медиатора по-прежнему требует специальных методов (IV или RCT для $M$).
Прямые и косвенные эффекты: NDE и NIE
С 2022 года FDA требует медиационный анализ для одобрения препаратов - разделение прямого и косвенного (через биологические пути) эффектов лечения. Natural Direct Effect (NDE) и Natural Indirect Effect (NIE) формализуют этот вопрос в языке контрфактуалов.
NDE + NIE = TE только при отсутствии взаимодействия X×M. Если взаимодействие есть - разложение усложняется: TE = CDE + PAI + PIE (four-way decomposition VanderWeele).
Что измеряет Natural Indirect Effect (NIE)?
NIE = E[Y(1,M(1)) - Y(1,M(0))]: фиксируем лечение на X=1, но меняем медиатор с M(0) на M(1). Это изолирует вклад пути X→M→Y в общий эффект.
Формула медиации и идентификация
При отсутствии конфаундеров X-M, X-Y и M-Y формула медиации Перля выражает NDE и NIE через наблюдаемое распределение. При рандомизации X достаточно наблюдать M и корректировать по базовым ковариатам.
При линейных моделях NIE = a×b (product of coefficients), NDE = c' (прямой коэффициент). Для нелинейных моделей или бинарных исходов нужны контрфактуальные формулы или bootstrap.
Что такое sequential ignorability в медиационном анализе?
Sequential ignorability: (1) Y(x,m) ⊥ X | Z - нет скрытого X-Y конфаундера; (2) Y(x,m) ⊥ M | X, Z - нет скрытого M-Y конфаундера. Оба нужны для идентификации NDE и NIE.
Анализ чувствительности в медиации
Sequential ignorability непроверяема в данных - как и no unmeasured confounding для ATE. Анализ чувствительности Imai et al. (2010) количественно оценивает: насколько должна коррелировать ошибка уравнения медиатора с ошибкой уравнения исхода, чтобы аннулировать NIE.
Стандартный отчёт: указывать NIE вместе с критическим ρ* и графиком NIE(ρ). Если |ρ*| < 0.2 - вывод о косвенном эффекте хрупкий и требует дополнительного обоснования или инструментальной переменной для M.
Что означает малое по модулю критическое значение ρ* в анализе чувствительности медиации?
Критическое ρ* - минимальная корреляция остатков, при которой NIE = 0. Малое |ρ*| означает, что незначительный скрытый конфаундер способен уничтожить косвенный эффект. Для надёжного вывода нужно |ρ*| > 0.3-0.4.
Линейная медиация: формула Барона-Кенни
При $Y = \alpha X + \beta M + \varepsilon_Y$ и $M = \gamma X + \varepsilon_M$: NDE $= \alpha$, NIE $= \beta\gamma$, полный эффект $= \alpha + \beta\gamma$. Доля опосредованного эффекта: $\frac{\beta\gamma}{\alpha + \beta\gamma}$. Это точно при линейности; для нелинейных моделей нужна общая формула медиации.
Итоги
- Полный эффект $= NDE + NIE$: прямой путь $X \to Y$ плюс косвенный $X \to M \to Y$
- Формула медиации Перла идентифицирует NDE/NIE под условием отсутствия конфаундинга медиатора
- Анализ чувствительности через $\rho$ показывает устойчивость выводов к нарушению предположений
Связь с другими темами
Медиационный анализ используется в алгоритмической справедливости для разделения допустимых и недопустимых путей воздействия признака на решение. Алгоритм PC для открытия каузальной структуры обнаруживает структуру медиации из наблюдательных данных.
- Связанные темы — развивает
Вопросы для размышления
- Когда NDE и NIE не складываются в полный эффект? При каком условии декомпозиция точна?
- Как идентифицировать NIE при наличии ненаблюдаемого конфаундера между $M$ и $Y$?
- В исследовании дискриминации при найме: как отличить законный путь 'квалификация' от прямого эффекта пола?