【原】非线性模型中乘数和边际交互效应选哪个？为什么呢？

计量经济圈 2020-06-30

展开全文

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

正文

关于下方文字内容，作者：韦忠吉，清华大学经管学院，通信邮箱：weizhj.18@sem.tsinghua.edu.cn

非线性模型，乘数交互效应和边际交互效应用哪个？

在非线性模型，例如logit，泊松回归，负二项回归中，乘数交互效应和边际交互效应应当选哪个？下面我们介绍的这篇文章认为，应当两个都要估计和报告。

Buis (2010)在展示了如何运用Stata计算非线性模型中的乘法交互效应（multiplicative interaction effect）。这很容易从标准的Stata输出中获得。此外，Buis将乘数交互效应和边际交互效应进行了对比，后者的正确计算（Ai 和 Norton，2003）需要在回归后进行额外的编程。在Stata计算中，margin这一命令简化了边际交互效应的计算，只需要短短几行（Karaca-Mandic，Norton 和Dowd，2012）。Buis解释了边际交互效应和乘数交互效应的不同，它们关注的是不同的问题，所以，对分析者而言，两种工具都很重要。

然而，现实中许多作者误解了Buis（2010），把这篇文章作为仅仅展现乘数交互效应的依据，例如Doidge，Karolyi和Stulz（2013）和Vaidyanathan（2011）。

本文旨在展示一个简单的、虚构的例子，以展示边际和乘数交互效应可以得出不同的结论。作者认为，除非分析者有强烈的理论偏好，在获得非线性模型后，他们一般需要把两种效应都报告出来。

在正式介绍作者给出的例子之前，我们先对一些知识点进行简单的回顾和说明。

概率尺度（probability scale）和优势尺度（odds scale）

概率尺度，也就是我们一般说的p，用某件事发生的概率作为度量标准，是一个[0,1]之间的实数。优势尺度，一般用作为度量标准，是一个0到正无穷的实数值，相比于 [0, 1] 的概率值具有更大的范围。同时，优势比例理解起来更直观，假设中国队世界杯夺冠的概率为 p = 0.01，大多数人对概率没有直观感觉。但如果换成优势比例为 1/99，其所表达的意思为如果赌博中国队世界杯夺冠100次，会输掉99次。若p接近0，则优势比例和概率较为接近，但一般情况下，它们有较大差别。

非线性模型

在本文中，我们使用具有二元因变量y的logit估计量（命令logit），它是两个二元解释变量x和z的函数，也就是。然而，本文所涉及内容可以一般化到所有的非线性模型，例如泊松模型（命令poisson）和负指数模型（命令nbreg），这二者通常从乘数效应予以解读。

下面给出logit模型下四种交互效应的表示方法，其中包括乘数交互和边际交互效应在概率尺度和优势尺度下的表示方法。我们将p定义为二元因变量y的期望概率，它是二元变量x，z及其交互项的条件期望。

四种交互效应的表示方法

3.1 概率尺度下的乘数交互效应：

若这一数值小于1，则说明当x上升时，z的效应下降了，反之则说明z的效应上升或不变。

Stata代码则可以在logit回归后用margin再用nlcom实现：

. logit y i.x##i.z //logit回归

. margins x#z, post //margin计算

. nlcom (b[1.x#1.z] / _b[1.x#0.z]) / (b[0.x#1.z] / _b[0.x#0.z])

 //计算乘数交互效应

3.2 概率尺度下的边际交互效应

可以用二者之差的差来表达：

这一数值为正，则说明当x上升时，z的效应上升，反之，z的效应下降或不变。

Stata代码也很简单，一行即可：

. margins, dydx(z) at(x=(0 1)) contrast(atcontrast(r._at)) post

3.3 优势尺度下的乘数交互效应

优势尺度的公式稍显复杂，但基本原理是一样的：

若这一数值小于1，则说明当x上升时，z的效应下降了，反之则说明z的效应上升或不变。

 代码操作则更为简单，需要用到or命令：

 . logit y i.x##i.z, or

3.4 优势尺度下的边际交互效应

这是一种比较少用的方式，其公式为：

这一数值为正，则说明当x上升时，z的效应上升，反之，z的效应下降或不变。Stata代码如下：

. margins x#z, expression(exp(xb())) post 

. lincom (b[1.x#1.z] - _b[1.x#0.z]) - (b[0.x#1.z] - _b[0.x#0.z]

Probit回归，泊松回归、负二项回归的操作与之类似。

下面正式介绍作者给出的例子，以说明只报告以上两种效应中的一个可能导致的后果。在这个例子中，两种效应会带来不同的结论。我们这个例子只包含四个点。

当x=0时，若z从0到1，出现积极的结果的概率p从0.05变为0.10。当x=1，z从0到1时，p从0.10到0.19。下图左、右分别是概率和优势比例度量下四个点的情况：

不难得出，概率度量下，乘数交互效应为0.95，即x上升时，z的效应下降。相反，优势比例度量下，乘数效应为1.0，即x上升时，z的效应不变。然而，概率度量下的边际效应为0.04，表明x上升时，z的效应上升。这个例子中，优势比例度量下的边际效应也是上升的，但其他例子中，它也可以和概率度量下的边际效应有显著差异。上述结果如下表所示：

 因此，在这个小例子中，交互效应可以使正的、负的或者为零，取决于差异是如何度量和回报的，当x上升时，z的效应为：

下降，由于概率度量的乘数交互效应；

上升，由于概率度量的边际交互效应；

为零，由于优势比例度量下的乘数交互效应；

上升，由于优势比例度量下的边际交互效应。

 下面进行进一步讨论。

作者以自然实验为背景，以便从直觉上理解上述例子。假设z是一个处理(z = 1)和控制(z = 0)组，x是一个时间的指标，前期 (x = 0)与后期 (x = 1)。我们的例子在前期并不是很平衡:作为对照，处理组的基本风险是控制组的两倍。

众所周知，当出现这种不平衡时，治疗效果的估计对功能形式很敏感。在上述例子中，控制组的结果随时间增加了一倍，增加了0.05;处理组的结果增加了更大的绝对量0.09，但没有翻倍。因此不同的干预效应的迹象出现了:0.04的边际效应展示了相对于控制组的绝对增长，处理组的p的增长；但0.95的乘数效应显示了处理组相对于控制组的乘数增长的负效应。在评价文献中，首选的解决方案是选择一个与基准相匹配的不同的控制组。有了更好的匹配，至少对于边际效应和乘数效应而言，交互效应的符号(尽管不是大小)是相同的。

另一个重要的点在于，若上述例子含有其他协变量，将在不同的观测值之间有不同的效应规模。在非线性模型中，边际效应的量并非常数，而是在观测值之间变化的（Ai和Norton，2003）。例如，尽管在逻辑斯谛模型中，优势比例在各观测值之间是一个常数，但若潜在的概率接近于50%，边际效应一般也会更大；若潜在概率接近0或1，边际效应一般会更小。另一方面，逻辑斯蒂回归的优势比例大小是由一个任意因素缩放的，当附加的协变量被添加到模型时，这个任意因素就会改变，使得大小的比较成为不可能（Norton，Dowd和Maciejewski，2018）。然而，边际效应对于模型的变化更为稳健。总之，对于更丰富的数据集，研究者应该意识到，处理效应会经常随着观测值而变化。因此，可以用margin命令来计算平均边际效应，这是一个对效应规模及其统计显著性的总的度量。

不同的学科传统倾向于默认这些交互效应的不同变体。且不论每种方法的优缺点（参见Norton和Dowd，2018；Mustillo，Landerman和Land，2012），作者认为如果只关注其中一种，就会产生误差。因此，在Buis（2010）的基础上，作者认为研究者应该同时估计乘数和边际交互效应，并记录关键干预的敏感性。

参考文献

Ai, C., and E. C. Norton. 2003. Interaction terms in logit and probit models. Economics Letters 80: 123–129.
Buis, M. 2010. Stata tip 87: Interpretation of interactions in nonlinear models. Stata Journal 10: 305–308.
Doidge, C., G. A. Karolyi, and R. M. Stulz. 2013. The U.S. left behind? Financial globalization and the rise of IPOs outside the U.S. Journal of Financial Economics 110: 546–573.
Karaca-Mandic, P., E. C. Norton, and B. Dowd. 2012. Interaction terms in nonlinear models. Health Services Research 47: 255–274.
Kolasinski, A. C., and A. F. Siegel. 2010. On the economic meaning of interaction term coeﬃcients in non-linear binary response regression models. Working Paper. https:// papers.ssrn.com/sol3/papers.cfm?abstract id=1668750.
Mustillo, S., L. R. Landerman, and K. C. Land. 2012. Modeling longitudinal count data: Testing for group diﬀerences in growth trajectories using average marginal eﬀects. Sociological Methods & Research 41: 467–487.
Norton, E. C., and B. E. Dowd. 2018. Log odds and the interpretation of logit models. Health Services Research 53: 859–878.
Norton, E. C., B. E. Dowd, and M. L. Maciejewski. 2018. Odds ratios—Current best practice and use. Journal of the American Medical Association 320: 84–85.
Vaidyanathan, B. 2011. Religious resources or diﬀerential returns? Early religious socialization and declining attendance in emerging adulthood. Journal for the Scientiﬁc Study of Religion 50: 366–387.