【原】文献荐读 | 第一部分因果推断：基本框架（1）

新用户68639482 2020-04-07

展开全文

来源：

翻译：陈昕欣

校对：龙哥

编辑：林毅

1.1 简介

在介绍性章节中，我们阐述了因果推断的基本框架，讨论了方法背后的三个关键概念。首先是潜在结果(potential outcomes)的概念，每个结果都对应于一种处理或试验(treatment or manipulation)，遵循“没有处理就没有因果关系”的格言（Rubin，1975，p238）。这些潜在结果在先验上(a priori)，都是可观测的，也就是说，如果个体接受了相应的处理，就可以观察到。但是，从后验上看(a posteriori)，一旦进行了处理，最多只能观察到一个潜在的结果。其次，我们讨论了在进行因果推断时，观察多个个体(multiple units)的必要性，以及相关稳定性假设的效用，事实上，我们在本书的大部分内容中都使用稳定性假设这一概念来处理存在的多个个体。最后，我们讨论了分配机制(assignment mechanism)的核心作用，这对于推断因果效应至关重要，而且不同的分配机制构成了本书的架构模块。

1.2 潜在结果(potential outcomes)

在日常生活中，因果语言被广泛地以非正式的方式使用。有人可能会说：“因为我服用了阿司匹林,所以我的头痛减弱了”，或者“因为她上了大学，所以她去年找到了一份好工作。”我们通常根据对过去结果的观察，得出这些评论，例如，服用或没有服用阿司匹林后头痛的结果，受过或未受过大学教育的人的工作特点，男孩或女孩通常的头发长度。因此，这些观察通常包括非正式的统计分析，从不同量的测度中得出结论，这些测量结果在个体之间存在差异性，通常被称为变量或随机变量——这种语言最早由Yule(1897)使用。然而，统计理论在因果关系问题上一直相对停滞不前。许多教科书，尤其是较老的教科书，除了在随机实验的情境下，都避免提及这一术语（因果推断）。有些人提到主要是为了强调相关性或关联性并不等同于因果关系，有些人甚至警告他们的读者要避免在统计中使用因果语言。然而，对于许多使用统计方法的人来说，因果关系恰恰正是他们所寻求的内容。

我们方法的基本概念是，因果关系与作用于一个个体的行为(action, 也被称为操纵、处理或干预)相联系。这里的一个个体可以是在特定时间点上的一个物理对象、一家公司、一个人，或者对象或人的集合，例如教室或市场。基于我们的目的，在不同的时间点上，相同的物理对象或人是不同的个体。从这个角度来看，因果陈述假定，虽然一个个体(在某一特定时间点)受到某一特定行为、处理、治疗或制度的影响，但同一单位也可能(在同一时间点)受到另一种行为、处理、治疗或制度的影响。例如，当你决定服用阿司匹林来缓解头痛时，你也可以选择不服用阿司匹林，或者你选择服用替代药物。在这个框架中，准确地阐明行为的性质和时间有时需要一定的想象力。例如，如果我们只根据肤色来判定种族，那么这一行为可能是一粒只改变肤色的药物。这种药物目前可能还不存在(但数百年前的心脏移植手术也不存在)，但我们仍然可以想象这样的行为。

本书主要考虑两个处理的情形，但对多值处理的扩展在概念上非常简单。通常，其中一种行为对应于更积极的处理(如服用阿司匹林)，而另一种行为则为相对被动的行为 (如不服用阿司匹林)。在这种情况下，我们有时称第一个行为为积极处理，与控制处理相对应；但这些只是标签，从形式上看，这两个行为/处理是对称的。在某些情况下，如果从上下文可以清晰地看出，我们简单地将更积极的处理称为“处理组”，而将另一种处理称为“控制组”。

给定一个个体和一组行为，我们将每个行为-个体对(action-unit pair)与一潜在结果关联起来。我们把这些结果称为潜在结果，因为最终只有一个会实现，继而可能被观察到：与实际采取的行为相对应的是潜在结果。事后无法观察到其他潜在结果，因为没有采取相应的行动来实现这些结果。一种行为或处理相对于另一种行为或处理的因果效应，涉及对潜在结果的比较，其中一个已经实现(尽管不一定能观察到)，而另一个尚未实现，因此也无法观察到。任何处理必须在观察到任何相关的潜在结果之前进行。

虽然前面的论点可能看来很明显，但它的关键作用是解释清楚原本模糊的概念，这可以通过考虑本节第一段中提出的三个非正式“因果”的例子来证明。在第一个例子中，很明显的动作是：我服用了阿司匹林，但在我服用阿司匹林的时候，我本可以选择不服用阿司匹林。在这种情况下，可能会产生不同的结果，而“因为”(because) 陈述在本书的观点中即是因果关系，因为它反映了这两种潜在结果的比较。在第二个例子中，不太清楚处理方法和替代方法是什么：她上了大学，在她决定上大学的时候，她本可以决定不上大学。在这种情况下，她可能在一年前换了一份工作，隐含的因果关系是将她现在实际从事的工作质量，与如果她没有上大学的话，一年前的工作质量进行了比较。然而，在这个例子中，替代方法有些模糊：如果她没有上大学，她会参军吗？因此，在替代方案下的潜在结果，即没有上大学时一年前获得的工作，并不像第一个例子中定义得那么明确。

在第三个例子中，替代方案一点也不清楚。非正式的说法是“她留长发是因为她是女孩。”从某种意义上说，隐含的处理是做一个女孩，而隐含的替代方案是做一个男孩，但没有明确的行动能让她成为男孩，并让我们观察这个人作为男孩时，头发长度的潜在结果。我们可以通过外科手术或激素治疗来定义这种处理，来阐明因果效应，所有在不同年龄段采取的行为都被具体指定，但很明显，因果效应可能取决于具体的替代行为和时间。但是，如上所述，没有明确说明的行为，使我们能够观察接受替代处理的个体。因此，在我们的研究方法中，这个“因为”陈述不能被定义为因果效应。

把这类因果问题排除在考虑之外似乎具有局限性<restrictive>。然而，在我们的框架内这样做的原因是，如果没有进一步解释干预措施，因果问题就没有明确定义。通过明确阐明替代的干预措施，我们就可以在框架内很好地阐释这些问题。例如,如果问题涉及“种族”的因果效应,那么简历上的种族变化(或其感知, Bertrand and Mullainathan,2004)就定义了一个正在考虑的因果效应,而如果这个问题是科幻性的，如决定肤色的染色体概念变动，就在考虑一个完全不同的因果效应。无论是哪一种操作，干预措施的明确描述都使这一问题在我们的框架内成为一个合理可信的因果问题。

一种解释这三种“因果”陈述之间的本质差异的方法是，在采用实际处理/行动之后，考虑与未采用处理相对应的潜在结果的反事实数值。在第一个例子中，所使用的处理方法是“服用阿司匹林”，而与事实相反的潜在结果是“未服用阿司匹林”下的头痛状态;在这里，考虑与事实相反的结果是明确无疑的。在第二个例子中，与事实相反的结果是如果她决定不上大学，一年前的工作境况。在最后一个例子中，与事实相反的结果——如果她是男孩而不是女孩，那么她的头发长度(注意在这个陈述中没有行为/处理)——根本没有明确定义，因此因果陈述的定义也相应地不明确。在实践中，定义明确的因果陈述和定义不明确的因果陈述间的区别是程度上。然而，重要的一点是，通过更精确地阐明干预措施（干预措施本可以使另一种潜在结果变为已实现的结果），因果关系的陈述会变得更加明确。

1.3 定义：因果效应

让我们考虑一个案例。在一个特定的时间点，我考虑是否服用阿司匹林治疗头痛。也就是说，有两种处理水平，服用阿司匹林和不服用阿司匹林。如果我服用阿司匹林，在一小时后，我的头痛可能会消失，也可能会持续。我们用Y(Aspirin)来表示这个结果，可以是“头痛”，也可以是“不头痛”。（我们可以在一小时后用更精确的方法来测量我的头痛状况，例如，用十分制给我的头痛水平打分，但这并不能改变这里涉及的基本问题）同样地，如果我不服用阿司匹林，在一小时后，我的头痛可能会持续，也可能不会；我们用Y(No Aspirin)表示这一潜在的结果，可以是“头痛”，或者“不头痛”。因此，存在两种潜在结果，Y(Aspirin)和Y(No Aspirin)。每个对应一种试验水平，试验的因果效应包括对这两种潜在结果的比较。因为在这个例子中，每个潜在结果只能取两个值，单位水平的因果效应——对同一单位的两种结果的比较——设计四种（2×2）可能性中的一种：

1. 只有服用阿司匹林，头痛才能消失；

Y(Aspirin) = 不头痛，Y(No Aspirin) = 头痛

2. 阿司匹林没有效果，两种情况下都头痛

Y(Aspirin) = 头痛，Y(No Aspirin) = 头痛

3. 阿司匹林没有效果，两种情况下头痛都消失了

Y(Aspirin) = 不头痛，Y(No Aspirin) = 不头痛

4. 只有不服用阿司匹林，头痛才能消失

Y(Aspirin) = 头痛，Y(No Aspirin) = 不头痛

表0.1 列示了Y(Aspirin) = 不头痛，Y(No Aspirin) =头痛的情况。在第二和第三种可能性下服用阿司匹林没有任何因果效应。在另外两种情况下，阿司匹林有因果效应，一种使头痛消失，另一种则不能让头痛消失。

因果效应的定义有两个重要方面。首先，因果效应的定义取决于潜在结果，但并不取决于实际观察到的结果。具体而言，我服用阿司匹林（因而无法观测到我没有服用阿司匹林时的头痛状况）或不服用阿司匹林（因而无法观测到我服用阿司匹林后的结果）并不影响因果效应的定义。第二，因果效应是比较同一个体、在试验后同一时间的潜在结果。特别地，因果效应并不是比较不同时间的结果，就像在我决定服用或不服用阿司匹林之前和之后比较头痛的状况。因此，“因果推断的基本问题”（Holland,1986,第947页）是最多只可以实现并观测到一种潜在结果的问题。如果你采取的行动是服用阿司匹林，那么你将观测到Y(Aspirin)，而永远不会知道Y(No Aspirin)的情况，因为你无法回到过去。同样地，如果你采取的行动是不服用阿司匹林，那么你将观测到Y(No Aspirin)而永远不会知道Y(Aspirin)的情况。类似地，以大学为例，我们知道受大学教育的结果，因为那位女士确实上过大学，所以我们永远不会知道如果她没有上过大学，她会从事什么工作。因此，一般来说，即使个体水平的因果效应（比较两种潜在结果）可能会很好地定义，但根据定义我们不能仅从单个已实现的潜在结果中了解其价值。表0.2 说明了阿司匹林例子的概念，假设你采取的行动是服用阿司匹林。

对于因果效应的估计，与因果效应的定义相对应，我们需要从对其定义的比较中找出不同之处。对于估计和推断，我们需要比较观察到的潜在结果的实现值。因为每个个体只有一个已实现的潜在结果，所以我们需要比较不同的个体。例如，同一物理对象的前后比较涉及到我们框架中不同的个体，而同时比较两个不同的物理对象也需要不同的个体。这种比较对于估计因果效应是至关重要的，但是不能据此定义因果效应。对于因果效应的估计，了解或假设为什么某些潜在结果实现了，而其他潜在结果却没有实现的原因也很重要。也就是说，我们需要考虑分配机制，这将在1.7节中介绍。然而，我们不需要考虑定义因果效应的分配机制：我们只需要做一个处理的思维试验，从而定义潜在结果。

1.4 常见的因果效应

上一节给出的因果效应的定义可能看起来有点正式或费解，讨论也有点沉闷，但这只是探讨我们在日常生活中使用因果效应这一概念的方式。此外，这种将因果效应定义为潜在结果比较的方法在当代文化中也经常使用，例如，在电影中。我们很多人都看过电影《生活多美好》(It’s a Wonderful Life)，其中吉米·斯图尔特饰演乔治·贝利。在这部电影中，乔治·贝利变得非常沮丧，他说，如果他没有出生，这个世界会变得更好。在这时，一位天使出现了，告诉他如果他没有出生，这个世界将会是什么样子。现在的世界是真实的，已经观察到的结果，但是天使向乔治展示了另一个潜在的结果，也就是乔治没有出生的结果。后果很明显，他的孩子不再存在，还有其他不幸的事件。例如，他的弟弟，在现实生活中是二战英雄，在反事实的世界中，他在8岁时因滑冰事故而溺水身亡，因为身为哥哥的乔治没有去救他。在反事实的世界中，药剂师填错了处方，并被判过失杀人罪，因为乔治没有像在真实世界中那样发现错误。乔治没有出生的因果效应是将有乔治的现实世界中的一系列事件与没有乔治的反事实世界中的一系列事件进行比较。在实际生活中，我们不可能同时看到两个世界，但在电影《生活多美好》中，乔治可以同时看到两个世界。

另一个有趣的比较是法律环境中的“要不是，如果没有”的概念。假设有人做了一件坏事第二个人受到了损害。从法律角度看，第二个人获得的损害是指在没有发生坏事时原告的经济地位（“如果没有”有害事件时的经济地位）与原告实际的经济地位之间的差距。很明显，这是未实现的潜在结果和已实现的潜在结果之间的比较，这种差异便是有害行为的因果效应。

未完待续…