反事实 | alex的算法技术日志

本文是对 Causal Inference and Machine Learning（在线书）第 16 章 Counterfactual Framework 一节的读书笔记，对应 Counterfactual Framework — causalmlbook.com。偏概念串讲：把原书从「什么叫因果问题」到「为什么不能用两组均值直接当 ATE」这条线捋清；具体估计方法（matching、IPW、双稳健等）书里后文还会展开，此处只记框架与记号。 1. 「能谈因果」与可操纵性（manipulability）原书强调：仅凭两组结果不同或变量与结果相关，不能自然推出因果；混淆、遗漏变量、选择机制等都会驱动观测差异。更关键的一点是：因果陈述往往针对的是可以施加的干预（treatment / policy）。若某个特征在科学或伦理意义上无法被「操纵」（例如单纯说「年龄本身」或「性别本身」直接造成收入差异），就不宜把它当成可干预的处理去谈「处理效应」——观测差异更可能来自结构因素、混淆或未观测变量。书中用年龄举例：不能直接下结论「更老导致收入更低」；但若讨论的是可实施的干预（例如为年长员工提供特定培训或设备），则可以讨论该干预对结果的因果效应。 2. 潜在结果（Rubin Causal Model, RCM）——记号一层纸对个体 i：记号含义处理变量 D_i 是否接受处理（书中常用 0/1；也可推广到多值）潜在结果 Y_i(1), Y_i(0) 若接受 / 未接受处理时，理论上会出现的结果观测结果 Y_i 实际只看到其中一个世界观测结果与潜在结果的关系（一致性写法的一种紧凑形式）： Y_i = D_i · Y_i(1) + (1 - D_i) · Y_i(0) 基本困难：对每个人而言，Y_i(1) 与 Y_i(0) 不能同时观测到——未发生的那一侧就是反事实（counterfactual），因果推断在数学上很像「带系统缺失的反事实填坑问题」。 3. RCM 里我常记的一条：可忽略性（ignorability）条件可忽略性（unconfoundedness / conditional independence）可写成： ( Y_i(1), Y_i(0) ) ⊥ D_i | X_i （读作：在给定 X_i 的条件下，潜在结果与是否处理独立。） ...