Causal Calculus
Три правила do-calculus
1995. Judea Pearl публикует три правила. На вид - формальная игра с операторами $\text{do}$. На деле - первый алгоритм, способный решить, идентифицируема ли причинно-следственная связь по данным наблюдений. Каждый A/B-тест Netflix, каждая CATE-оценка в медицинском AI, каждая off-policy оценка в RL - всё стоит на этих трёх правилах. Backdoor и frontdoor оказались просто их частными случаями.
- **Computational advertising uplift (Bottou et al. 2013, JMLR):** оценка $P(\text{click} \mid \text{do}(\text{ad-shown}))$ через структурную каузальную модель ставок и кликов в Bing. Без do-исчисления - только корреляция между показом и кликом, смешанная с self-selection
- **CATE в medical AI (Wager-Athey 2018, JASA):** causal forests оценивают персонализированный $\tau(x) = \mathbb{E}[Y(1) - Y(0) \mid X=x]$. Под капотом - backdoor adjustment, формально выведенная из Правил 2 и 3
- **DoWhy (Microsoft Research):** open-source библиотека, реализующая ID-алгоритм Shpitser-Pearl 2006. Принимает DAG, выдаёт формулу идентификации причинного эффекта - повторное применение трёх правил под капотом
- **Off-policy evaluation в RL:** оценка $V^{\pi'}$ по логам от другой политики $\pi$ - identifiability в MDP с конфаундерами. Прямое применение do-исчисления к контекстуальным бандитам и медицинским decision support systems
Предварительные знания
- d-separation: умение читать conditional independence в DAG
- do-оператор и mutilated graph: $G_{\bar{X}}$ - удаление входящих рёбер в $X$
Правило 1: вставка/удаление наблюдений
1995 год. Judea Pearl публикует в Biometrika статью на 30 страниц. Внутри - три правила, переписывающие выражения с $\text{do}$. На вид - формальная игра с символами. На деле - первый алгоритм, способный решить, идентифицируем ли причинный эффект по наблюдательным данным. Каждый A/B-тест Netflix, каждая CATE-оценка в медицинском AI стоят на этих трёх правилах.
Перед тем как сформулировать первое правило - короткий ликбез по граф-хирургии. $G_{\bar{X}}$ - граф, в котором удалены все рёбра, ВХОДЯЩИЕ в $X$. $G_{\underline{X}}$ - граф, где удалены все рёбра, ИСХОДЯЩИЕ из $X$. Первая операция изолирует $X$ от его естественных причин (это и есть смысл $\text{do}(x)$). Вторая - изолирует $X$ от его эффектов.
**Графовая интуиция:** интервенция $\text{do}(X=x)$ физически разрывает все стрелки, входящие в $X$ из родителей. Поэтому d-separation в $G_{\bar{X}}$ - это d-separation **в мире после интервенции**. Все три правила Pearl сводятся к проверке conditional independence в подходящем мутилированном графе.
**Правило 1 (вставка/удаление наблюдений):**
Перевод на человеческий: если в графе с уже выполненной интервенцией $\text{do}(x)$ переменная $Z$ d-отделена от $Y$ при условии $X, W$ - то $Z$ бесполезна как conditioning. Её можно вставлять или удалять из выражения, ничего не меняя. Это прямое расширение классического свойства условной независимости из probability на интервенциональные распределения.
**Probability-аналог:** Правило 1 - точный двойник теоремы $P(y \mid x, z) = P(y \mid x)$ при $Y \perp\!\!\!\perp Z \mid X$ из обычной теории вероятностей. Только проверка независимости делается не в исходном графе, а в $G_{\bar{X}}$ - графе после интервенции.
Граф: $X \to Y$, $W \to X$, $W \to Y$, $Z \to W$. Применимо ли Правило 1 для упрощения $P(y \mid \text{do}(x), z, w)$ в $P(y \mid \text{do}(x), w)$?
Правило 2: обмен действия и наблюдения
Самое глубокое из трёх. Правило 2 говорит, **когда intervention неотличима от observation** - когда $\text{do}(z)$ можно заменить на простое conditioning $z$. Именно это и делает каждый правильный observational study.
Граф $G_{\bar{X}, \underline{Z}}$ - удалены все рёбра, входящие в $X$, и все рёбра, исходящие из $Z$. Удаление исходящих из $Z$ изолирует $Z$ от своих эффектов. Если в этом гибридном графе $Z$ всё ещё d-отделена от $Y$ при условии $X, W$ - значит вся связь $Z \to Y$ шла **только через эффекты $Z$**, а не через общих предков. Тогда вмешательство и наблюдение дают одинаковую вероятность.
Это и есть формализованный смысл backdoor criterion. Если $W$ блокирует все backdoor-пути от $Z$ к $Y$ - значит в $G_{\bar{X}, \underline{Z}}$ $Z$ изолирована от $Y$ (исходящие удалены, остались только backdoor-связи, и они блокированы $W$). Применяем Правило 2 - и интервенция $\text{do}(z)$ превращается в наблюдение $z$. Получается формула adjustment.
**Backdoor как теорема, а не определение.** Pearl 1993 ввёл backdoor criterion как технику. Pearl 1995 показал: backdoor adjustment - просто комбинация Правил 2 и 3 do-исчисления. То же самое для frontdoor (следующая концепция). Все известные техники идентификации оказались частными случаями трёх правил.
Когда $P(y \mid \text{do}(z), w) = P(y \mid z, w)$ - то есть intervention неотличима от observation?
Правило 3: вставка/удаление действий
Третье правило самое тонкое. Оно говорит, **когда intervention бесполезна** - когда $\text{do}(z)$ ничего не меняет и его можно убрать.
Здесь $Z(W)$ - подмножество $Z$, не являющееся предками $W$ в $G_{\bar{X}}$. Удаляются ВХОДЯЩИЕ рёбра в эти узлы (черта сверху, не снизу). Идея: если после интервенции $\text{do}(x)$ переменная $Z$ d-отделена от $Y$ при условии $W$ - значит у $Z$ нет работающих путей до $Y$, и фиксировать её бессмысленно.
Сравнение трёх правил по типу операции на $Z$:
**Frontdoor через три правила.** Pearl показал в 1995, что frontdoor formula $P(y \mid \text{do}(x)) = \sum_m P(m \mid x) \sum_{x'} P(y \mid x', m) P(x')$ выводится последовательностью применений Правил 2 и 3 к выражению $P(y \mid \text{do}(x))$ на DAG $X \leftarrow U \rightarrow Y$, $X \to M \to Y$. Никаких ad-hoc построений - только три правила и d-separation.
Какое правило формализует frontdoor adjustment?
ID-алгоритм и применения
Три правила Pearl сами по себе - ещё не алгоритм. Это переписывающая система. Открытый вопрос 1995-2006: можно ли по DAG **за конечное число шагов** решить, идентифицируем ли произвольный причинный запрос $P(y \mid \text{do}(x), z)$, и если да - выписать формулу через observational distribution?
**Shpitser-Pearl 2006.** Полный (complete) алгоритм идентификации. Принимает на вход DAG и причинный запрос. Возвращает либо явную формулу через $P(V_1, \ldots, V_n)$ (наблюдательное распределение), либо доказательство неидентифицируемости через структуру C-component'ов и hedge'ов. Полнота: если ID-алгоритм говорит 'неидентифицируемо' - никакая другая техника не поможет.
**ML-приложения.** Microsoft Bing ad placement (Bottou et al. 2013, JMLR, "Counterfactual Reasoning and Learning Systems") - оценка $P(\text{click} \mid \text{do}(\text{ad-shown}))$ через структурную каузальную модель аукциона и пользователя. Causal CATE в medical AI (Wager-Athey 2018, JASA) - оценка персонализированного эффекта лечения через causal forests, опирающиеся на backdoor adjustment. Off-policy evaluation в RL - вычисление $V^{\pi'}$ по данным от $\pi$, фактически identifiability в бандитских MDP.
**Transportability** (Pearl-Bareinboim 2014) - расширение do-исчисления на перенос причинных эффектов между популяциями. Правила всё те же три, плюс selection diagram - граф с дополнительными узлами $S$, помечающими различия. ID-алгоритм там же отвечает: можно ли перенести $P(y \mid \text{do}(x))$ из исследования в Бостоне на популяцию Сан-Паулу. Прямое применение в robust transfer learning и domain adaptation.
Три правила do-исчисления - философская формализация, далёкая от практики
Три правила - двигатель ID-алгоритма (DoWhy, EconML), стоящий за каждой production CATE-оценкой и uplift-моделью
Pearl 1995 ввёл правила. Shpitser-Pearl 2006 показал их полноту. Microsoft Research (DoWhy 2018), Microsoft EconML (2019), Uber CausalML (2019) реализовали ID-алгоритм в open-source. Каждая backdoor/frontdoor adjustment formula, которую выдаёт DoWhy в production - результат повторного применения этих трёх правил. Без них - только эвристики.
Что гарантирует Shpitser-Pearl ID-algorithm 2006?
Ключевые идеи
- **Правило 1** - вставка/удаление наблюдений: $Z$ можно убрать из conditioning, если $(Y \perp\!\!\!\perp Z \mid X, W)_{G_{\bar{X}}}$. Прямое расширение классической условной независимости на интервенциональные распределения
- **Правило 2** - обмен: $\text{do}(z)$ превращается в наблюдение $z$, если $(Y \perp\!\!\!\perp Z \mid X, W)_{G_{\bar{X}, \underline{Z}}}$. Backdoor adjustment - частный случай
- **Правило 3** - удаление действий: $\text{do}(z)$ можно убрать, если $(Y \perp\!\!\!\perp Z \mid X, W)_{G_{\bar{X}, \overline{Z(W)}}}$. Совместно с Правилом 2 даёт frontdoor
- **Полнота (Shpitser-Pearl 2006):** ID-алгоритм решает идентифицируемость произвольного $P(y \mid \text{do}(x), z)$ за конечное число применений трёх правил. Если алгоритм не нашёл формулу - её не существует
- **ML-применения:** computational advertising uplift, медицинский CATE, off-policy RL, transportability - все построены на do-исчислении. DoWhy и EconML - production-реализации
Куда дальше
Три правила открывают всю теорию идентифицируемости и современный causal ML:
- Идентифицируемость и ID-алгоритм — Shpitser-Pearl 2006: complete алгоритм, построенный на повторных применениях трёх правил
- Mediation analysis — Декомпозиция total effect на direct и indirect через do-исчисление
- Transportability — Перенос causal effects между популяциями - расширение трёх правил с selection diagrams
- Double ML и CATE — Production-стек оценки персонализированных эффектов поверх identification
Вопросы для размышления
- Backdoor и frontdoor оказались частными случаями Правил 2 и 3. Какие ещё практические adjustment-техники из эконометрики и эпидемиологии могут быть выведены через do-исчисление - и какие принципиально не выводятся (instrumental variables, например)?
- ID-алгоритм отвечает: 'формула существует' или 'не существует при данном DAG'. Что это означает для случая, когда DAG задан с ошибкой? Как отличить ошибку графа от структурной неидентифицируемости?
- Off-policy evaluation в RL - identifiability в MDP с потенциальными confounders. Как три правила применяются к контекстуальным бандитам, где действие $A$ зависит от контекста $X$ и потенциально от ненаблюдаемого $U$, влияющего на reward $R$?
Связанные уроки
- cc-02-d-separation — d-separation - язык, на котором сформулированы все три правила
- cc-05-do-operator — do-оператор и mutilated graph - объекты, которыми оперируют правила
- cc-03-backdoor — Backdoor adjustment - частный случай Правила 2
- cc-04-frontdoor — Frontdoor - комбинация Правил 2 и 3 при наличии медиатора
- cc-07-identifiability — ID-алгоритм Shpitser-Pearl 2006 строится на повторных применениях этих правил
- cc-12-double-ml-cate — Double ML и CATE - инженерные надстройки над теорией do-исчисления
- stat-01-sampling