因果推断笔记:Causal ML Book 第 16 章 反事实框架与 Rubin 因果模型

本文是对 Causal Inference and Machine Learning(在线书)第 16 章 Counterfactual Framework 一节的读书笔记,对应 Counterfactual Framework — causalmlbook.com。偏概念串讲:把原书从「什么叫因果问题」到「为什么不能用两组均值直接当 ATE」这条线捋清;具体估计方法(matching、IPW、双稳健等)书里后文还会展开,此处只记框架与记号。 1. 「能谈因果」与可操纵性(manipulability) 原书强调:仅凭两组结果不同或变量与结果相关,不能自然推出因果;混淆、遗漏变量、选择机制等都会驱动观测差异。 更关键的一点是:因果陈述往往针对的是可以施加的干预(treatment / policy)。若某个特征在科学或伦理意义上无法被「操纵」(例如单纯说「年龄本身」或「性别本身」直接造成收入差异),就不宜把它当成可干预的处理去谈「处理效应」——观测差异更可能来自结构因素、混淆或未观测变量。书中用年龄举例:不能直接下结论「更老导致收入更低」;但若讨论的是可实施的干预(例如为年长员工提供特定培训或设备),则可以讨论该干预对结果的因果效应。 2. 潜在结果(Rubin Causal Model, RCM)——记号一层纸 对个体 i: 记号 含义 处理变量 D_i 是否接受处理(书中常用 0/1;也可推广到多值) 潜在结果 Y_i(1), Y_i(0) 若接受 / 未接受处理时,理论上会出现的结果 观测结果 Y_i 实际只看到其中一个世界 观测结果与潜在结果的关系(一致性写法的一种紧凑形式): Y_i = D_i · Y_i(1) + (1 - D_i) · Y_i(0) 基本困难:对每个人而言,Y_i(1) 与 Y_i(0) 不能同时观测到——未发生的那一侧就是反事实(counterfactual),因果推断在数学上很像「带系统缺失的反事实填坑问题」。 3. RCM 里我常记的一条:可忽略性(ignorability) 条件可忽略性(unconfoundedness / conditional independence)可写成: ( Y_i(1), Y_i(0) ) ⊥ D_i | X_i (读作:在给定 X_i 的条件下,潜在结果与是否处理独立。) ...

April 12, 2026 · 1 min