Causal Calculus

Три правила do-calculus

1995. Judea Pearl публикует три правила. На вид - формальная игра с операторами $\text{do}$. На деле - первый алгоритм, способный решить, идентифицируема ли причинно-следственная связь по данным наблюдений. Каждый A/B-тест Netflix, каждая CATE-оценка в медицинском AI, каждая off-policy оценка в RL - всё стоит на этих трёх правилах. Backdoor и frontdoor оказались просто их частными случаями.

  • **Computational advertising uplift (Bottou et al. 2013, JMLR):** оценка $P(\text{click} \mid \text{do}(\text{ad-shown}))$ через структурную каузальную модель ставок и кликов в Bing. Без do-исчисления - только корреляция между показом и кликом, смешанная с self-selection
  • **CATE в medical AI (Wager-Athey 2018, JASA):** causal forests оценивают персонализированный $\tau(x) = \mathbb{E}[Y(1) - Y(0) \mid X=x]$. Под капотом - backdoor adjustment, формально выведенная из Правил 2 и 3
  • **DoWhy (Microsoft Research):** open-source библиотека, реализующая ID-алгоритм Shpitser-Pearl 2006. Принимает DAG, выдаёт формулу идентификации причинного эффекта - повторное применение трёх правил под капотом
  • **Off-policy evaluation в RL:** оценка $V^{\pi'}$ по логам от другой политики $\pi$ - identifiability в MDP с конфаундерами. Прямое применение do-исчисления к контекстуальным бандитам и медицинским decision support systems

Предварительные знания

  • d-separation: умение читать conditional independence в DAG
  • do-оператор и mutilated graph: $G_{\bar{X}}$ - удаление входящих рёбер в $X$
  • d-separation
  • do(X) Operator: Intervention vs Observation

Правило 1: вставка/удаление наблюдений

1995 год. Judea Pearl публикует в Biometrika статью на 30 страниц. Внутри - три правила, переписывающие выражения с $\text{do}$. На вид - формальная игра с символами. На деле - первый алгоритм, способный решить, идентифицируем ли причинный эффект по наблюдательным данным. Каждый A/B-тест Netflix, каждая CATE-оценка в медицинском AI стоят на этих трёх правилах.

Перед тем как сформулировать первое правило - короткий ликбез по граф-хирургии. $G_{\bar{X}}$ - граф, в котором удалены все рёбра, ВХОДЯЩИЕ в $X$. $G_{\underline{X}}$ - граф, где удалены все рёбра, ИСХОДЯЩИЕ из $X$. Первая операция изолирует $X$ от его естественных причин (это и есть смысл $\text{do}(x)$). Вторая - изолирует $X$ от его эффектов.

**Графовая интуиция:** интервенция $\text{do}(X=x)$ физически разрывает все стрелки, входящие в $X$ из родителей. Поэтому d-separation в $G_{\bar{X}}$ - это d-separation **в мире после интервенции**. Все три правила Pearl сводятся к проверке conditional independence в подходящем мутилированном графе.

**Правило 1 (вставка/удаление наблюдений):**

Перевод на человеческий: если в графе с уже выполненной интервенцией $\text{do}(x)$ переменная $Z$ d-отделена от $Y$ при условии $X, W$ - то $Z$ бесполезна как conditioning. Её можно вставлять или удалять из выражения, ничего не меняя. Это прямое расширение классического свойства условной независимости из probability на интервенциональные распределения.

**Probability-аналог:** Правило 1 - точный двойник теоремы $P(y \mid x, z) = P(y \mid x)$ при $Y \perp\!\!\!\perp Z \mid X$ из обычной теории вероятностей. Только проверка независимости делается не в исходном графе, а в $G_{\bar{X}}$ - графе после интервенции.

Граф: $X \to Y$, $W \to X$, $W \to Y$, $Z \to W$. Применимо ли Правило 1 для упрощения $P(y \mid \text{do}(x), z, w)$ в $P(y \mid \text{do}(x), w)$?

Правило 2: обмен действия и наблюдения

Самое глубокое из трёх. Правило 2 говорит, **когда intervention неотличима от observation** - когда $\text{do}(z)$ можно заменить на простое conditioning $z$. Именно это и делает каждый правильный observational study.

Граф $G_{\bar{X}, \underline{Z}}$ - удалены все рёбра, входящие в $X$, и все рёбра, исходящие из $Z$. Удаление исходящих из $Z$ изолирует $Z$ от своих эффектов. Если в этом гибридном графе $Z$ всё ещё d-отделена от $Y$ при условии $X, W$ - значит вся связь $Z \to Y$ шла **только через эффекты $Z$**, а не через общих предков. Тогда вмешательство и наблюдение дают одинаковую вероятность.

Это и есть формализованный смысл backdoor criterion. Если $W$ блокирует все backdoor-пути от $Z$ к $Y$ - значит в $G_{\bar{X}, \underline{Z}}$ $Z$ изолирована от $Y$ (исходящие удалены, остались только backdoor-связи, и они блокированы $W$). Применяем Правило 2 - и интервенция $\text{do}(z)$ превращается в наблюдение $z$. Получается формула adjustment.

**Backdoor как теорема, а не определение.** Pearl 1993 ввёл backdoor criterion как технику. Pearl 1995 показал: backdoor adjustment - просто комбинация Правил 2 и 3 do-исчисления. То же самое для frontdoor (следующая концепция). Все известные техники идентификации оказались частными случаями трёх правил.

Когда $P(y \mid \text{do}(z), w) = P(y \mid z, w)$ - то есть intervention неотличима от observation?

Правило 3: вставка/удаление действий

Третье правило самое тонкое. Оно говорит, **когда intervention бесполезна** - когда $\text{do}(z)$ ничего не меняет и его можно убрать.

Здесь $Z(W)$ - подмножество $Z$, не являющееся предками $W$ в $G_{\bar{X}}$. Удаляются ВХОДЯЩИЕ рёбра в эти узлы (черта сверху, не снизу). Идея: если после интервенции $\text{do}(x)$ переменная $Z$ d-отделена от $Y$ при условии $W$ - значит у $Z$ нет работающих путей до $Y$, и фиксировать её бессмысленно.

Сравнение трёх правил по типу операции на $Z$:

**Frontdoor через три правила.** Pearl показал в 1995, что frontdoor formula $P(y \mid \text{do}(x)) = \sum_m P(m \mid x) \sum_{x'} P(y \mid x', m) P(x')$ выводится последовательностью применений Правил 2 и 3 к выражению $P(y \mid \text{do}(x))$ на DAG $X \leftarrow U \rightarrow Y$, $X \to M \to Y$. Никаких ad-hoc построений - только три правила и d-separation.

Какое правило формализует frontdoor adjustment?

ID-алгоритм и применения

Три правила Pearl сами по себе - ещё не алгоритм. Это переписывающая система. Открытый вопрос 1995-2006: можно ли по DAG **за конечное число шагов** решить, идентифицируем ли произвольный причинный запрос $P(y \mid \text{do}(x), z)$, и если да - выписать формулу через observational distribution?

**Shpitser-Pearl 2006.** Полный (complete) алгоритм идентификации. Принимает на вход DAG и причинный запрос. Возвращает либо явную формулу через $P(V_1, \ldots, V_n)$ (наблюдательное распределение), либо доказательство неидентифицируемости через структуру C-component'ов и hedge'ов. Полнота: если ID-алгоритм говорит 'неидентифицируемо' - никакая другая техника не поможет.

**ML-приложения.** Microsoft Bing ad placement (Bottou et al. 2013, JMLR, "Counterfactual Reasoning and Learning Systems") - оценка $P(\text{click} \mid \text{do}(\text{ad-shown}))$ через структурную каузальную модель аукциона и пользователя. Causal CATE в medical AI (Wager-Athey 2018, JASA) - оценка персонализированного эффекта лечения через causal forests, опирающиеся на backdoor adjustment. Off-policy evaluation в RL - вычисление $V^{\pi'}$ по данным от $\pi$, фактически identifiability в бандитских MDP.

**Transportability** (Pearl-Bareinboim 2014) - расширение do-исчисления на перенос причинных эффектов между популяциями. Правила всё те же три, плюс selection diagram - граф с дополнительными узлами $S$, помечающими различия. ID-алгоритм там же отвечает: можно ли перенести $P(y \mid \text{do}(x))$ из исследования в Бостоне на популяцию Сан-Паулу. Прямое применение в robust transfer learning и domain adaptation.

Три правила do-исчисления - философская формализация, далёкая от практики

Три правила - двигатель ID-алгоритма (DoWhy, EconML), стоящий за каждой production CATE-оценкой и uplift-моделью

Pearl 1995 ввёл правила. Shpitser-Pearl 2006 показал их полноту. Microsoft Research (DoWhy 2018), Microsoft EconML (2019), Uber CausalML (2019) реализовали ID-алгоритм в open-source. Каждая backdoor/frontdoor adjustment formula, которую выдаёт DoWhy в production - результат повторного применения этих трёх правил. Без них - только эвристики.

Что гарантирует Shpitser-Pearl ID-algorithm 2006?

Ключевые идеи

  • **Правило 1** - вставка/удаление наблюдений: $Z$ можно убрать из conditioning, если $(Y \perp\!\!\!\perp Z \mid X, W)_{G_{\bar{X}}}$. Прямое расширение классической условной независимости на интервенциональные распределения
  • **Правило 2** - обмен: $\text{do}(z)$ превращается в наблюдение $z$, если $(Y \perp\!\!\!\perp Z \mid X, W)_{G_{\bar{X}, \underline{Z}}}$. Backdoor adjustment - частный случай
  • **Правило 3** - удаление действий: $\text{do}(z)$ можно убрать, если $(Y \perp\!\!\!\perp Z \mid X, W)_{G_{\bar{X}, \overline{Z(W)}}}$. Совместно с Правилом 2 даёт frontdoor
  • **Полнота (Shpitser-Pearl 2006):** ID-алгоритм решает идентифицируемость произвольного $P(y \mid \text{do}(x), z)$ за конечное число применений трёх правил. Если алгоритм не нашёл формулу - её не существует
  • **ML-применения:** computational advertising uplift, медицинский CATE, off-policy RL, transportability - все построены на do-исчислении. DoWhy и EconML - production-реализации

Куда дальше

Три правила открывают всю теорию идентифицируемости и современный causal ML:

  • Идентифицируемость и ID-алгоритм — Shpitser-Pearl 2006: complete алгоритм, построенный на повторных применениях трёх правил
  • Mediation analysis — Декомпозиция total effect на direct и indirect через do-исчисление
  • Transportability — Перенос causal effects между популяциями - расширение трёх правил с selection diagrams
  • Double ML и CATE — Production-стек оценки персонализированных эффектов поверх identification

Вопросы для размышления

  • Backdoor и frontdoor оказались частными случаями Правил 2 и 3. Какие ещё практические adjustment-техники из эконометрики и эпидемиологии могут быть выведены через do-исчисление - и какие принципиально не выводятся (instrumental variables, например)?
  • ID-алгоритм отвечает: 'формула существует' или 'не существует при данном DAG'. Что это означает для случая, когда DAG задан с ошибкой? Как отличить ошибку графа от структурной неидентифицируемости?
  • Off-policy evaluation в RL - identifiability в MDP с потенциальными confounders. Как три правила применяются к контекстуальным бандитам, где действие $A$ зависит от контекста $X$ и потенциально от ненаблюдаемого $U$, влияющего на reward $R$?

Связанные уроки

  • cc-02-d-separation — d-separation - язык, на котором сформулированы все три правила
  • cc-05-do-operator — do-оператор и mutilated graph - объекты, которыми оперируют правила
  • cc-03-backdoor — Backdoor adjustment - частный случай Правила 2
  • cc-04-frontdoor — Frontdoor - комбинация Правил 2 и 3 при наличии медиатора
  • cc-07-identifiability — ID-алгоритм Shpitser-Pearl 2006 строится на повторных применениях этих правил
  • cc-12-double-ml-cate — Double ML и CATE - инженерные надстройки над теорией do-исчисления
  • stat-01-sampling
Три правила do-calculus

0

1

Войти