DID运用经典文献，强制性许可:来自对敌贸易法的证据

对对子不错 2018-01-21

展开全文

econometrics666@sina.cn

这是计量经济圈 Causal effect文献交流小组的第一篇经典文献阅读推文，这个Ca文献交流小组第一期推文会陆续在计量经济圈刊发。Ca文献交流小组第二期正在招募，如果希望与其他经典文献推文作者交流并且自己也能够主持一篇文献，那可以加入咱们的第二期交流小组（请到文末“阅读原文”）。

下载链接（实际已经在AER发表）：

http://www./papers/w15598.pdf

今天给大家带来的是一篇发表在AER上的关于DID方法运用的经典文章，内容是Compulsory Licensing: Evidence from the Trading with the Enemy Act，这个论文的中心思想是研究在没有经过外国专利所有者同意情况下，一些发展中国家实施强制许可制度，即允许本国公司利用外国专利生产最终会促进还是抑制本国的发明创造。

为了检验该命题，本文借助于一战后1917年10月6日通过的敌对国家贸易法案（TWEA）这个外生的自然实验，利用美国专利与贸易办公室（USPTO）有机化学产业业中19个主行业（下含7248个子行业）1875-1939年的数据，其中336个子行业是受到了强制许可制度影响的处理组，结果显示受强制许可影响的子行业的国内技术发明得到了极大的增长，在那些至少得到一个强制专利许可的子产业在TWEA法案出台后，相比那些未强制许可行业的技术发明平均每年要多0.151个，比平均水平的0.619个技术发明要高出25%。

同时还验证了国内企业通过干中学方法，利用外国技术发明然后形成自己的生产能力的影响机制。本文思路简单明了，其最出彩的地方就是在DID之后，通过DDD、IV、falsification test等检验进行了大量稳健性分析，保证了结果的稳健性，堪称DID的范本文献。

在介绍这篇文章具体是如何使用did的时候，我想先说一点，其实有很多时候写作要比方法重要得多，同样的食材顶级厨师和一般人做出的菜当然味道不一样，论文也是如此，所以我在开始之前还是想给大家看看，顶级的作者是如何展开论述，引出问题的。下面，我把引言和背景的段落梗概列出来，看看大牛是如何一步一步开展论证的。

Paragraph1：首先陈述事实，强制许可的一些好处；其次说明有一些反对的声音。

Paragraph2：直接点出一个一直以来被忽视的问题（本文的研究）。有可能促进，有可能降低，并说明原因。

Paragraph3：为了检验上述问题，我们利用了Trading with the Enemy Act (TWEA).作为政策冲击，并检验介绍TWEA的内容。

Paragraph4：为了达成以上目的，我们是如何构建DID的。利用政策影响前后不同行业发明专利的差异，这可以使我们排出其余干扰性的因素。

Paragraph5：介绍被解释变量：虚拟变量、数量、时长

Paragraph6：介绍被解释变量和数据格式

Paragraph7：介绍本文的主要发现。

Paragraph8：我们还检验了时间趋势，因为“干中学”需要时间。况且有证据说明处理组的研发水平在TWEA之前本身就更低。

Paragraph9：我们发现强制许可的效果是有时滞的，大概在8-9年左右。

Paragraph10：提出了潜在的质疑：政策时间和给予的专利可能是随机的，但是处理组的选取可能并不随机。首先，他有可能倾向于将专利授予那些国内产品需求较大的行业，这样我们所观测到的效应可能是强制许可和需求的交互影响。其次，也有可能是政府倾向于将专利授予那些本身发展比较差的行业。

Paragraph11：除上上述问题，我们的研究还可能面临一系列因素的干扰。例如：控制组有可能收到德国竞争者突然减少的影响。对此我们利用DDD来对此做出检验。另外我们还做了反事实检验来控制其他非观测性的因素。

Paragraph12：我们利用IV来说明解决我们刚刚提到的内生性问题。选取的IV为“敌国专利的数量”，结果发现did低估了强制许可的效果。

Paragraph13：我们还做了一系列稳健性检验，包括控制了事前的时间趋势和行业层面的差异，并且只用主行业样本进行回归，我们还用了专门的一个大类（靛蓝染料行业）来进行检验。

Paragraph14：在本文的最后一个部分，我们利用了企业层面的数据分析了只有杜邦公司有的专利和其余大家共享的专利做了比较，发现两种机制都很重要，但是杜邦独享的专利对自身的研发促进作用要更强。

Paragraph15：介绍了接下来本文的安排。

下面开始计量部分：

首先，作者用几段内容说明TWEA作为外生冲击的外生性，也就是告诉我们这个自然实验的合理性。

其次，介绍了数据：

①解释变量：剥夺了4500多个外国专利，其中727个被授予了化学行业中19个主行业，7248个次行业，其中336个是处理组。

②被解释变量：1875-1939年美国19个主行业中一共128953个专利。

③测量误差和衰减偏误（总是朝向零的估计量偏误,因而有衰减偏误的估计量的期望值小于参数的绝对值）

来源一：由于OCR软件识别国籍的时候造成误差。（手动整理了一部分与OCR做了比较）

来源二：行业的划分是不断变化的，为此我们控制了行业的固定效应。（我们假设只有处理组受到专利授予的影响，行业之间的扩散效应是我们不能忽视的，但是这个并不重要，因为这样只会造成结果的低估。）

1. OLS回归（利用下面这最普通的did的模型设定）

回归结果如下：

有一个问题，β只有在处理组和控制组其余所有不因TWEA所导致的不同都相同时，才是一致的估计。但是一个问题是处理组中因为战争导致德国竞争者的数目一度急剧下降，这有可能造成我们的估计偏误，于是作者统计了行业中的德国发明家的数量。结果发现，并没有证据表明，德国发明家的数量只在处理组或者控制组中减少，事实上在所有行业中的变化都是一致的。如下图：

2. 考虑事前趋势

众所周知，did的使用一个最重要的前提就是要满足平行趋势的假设，究竟这个平行趋势假设如何去检验，及如何具体操作的问题，这篇文章给我们做了一个很好的示范。具体的，用下面这个方程：

圈友们会问，这个β后面怎么跟了三个连乘项，具体的数据结构又是什么的呢，我们用如下的三张图来演示这个方程背后的数据结构（北京是处理组，上海是对照组）：

首先β×year之后数据变成了：

其次，β×year×treat变成了：

最后，β×year×treat×pre1919（这是一个虚拟变量，1919之前为1，之后为0）：

其实，所谓的事前平行趋势检验就是把上面这幅图中所有1的样本一回归，结果发现不显著，这就说明事前是平行的，如果这时候发现依然显著，这就说明你的处理组和对照组的不满足事前平行趋势假设，在政策实施开始之前就有显著不同的发展趋势。而这个回归的结果，满足要求，如下图：

3. 动态效应检验

动态效应检验其实就是把上面的事前趋势如法炮制，只不过1919年之后赋值为1就可以了。

首先是利用虚拟变量回归：

其次，解释变量不再是是不是受到法案影响，而是受到多少个专利的连续变量，这也就是所谓的连续性did。

关于这种图如何看是否显著的问题，是这样，如果上下区间（即虚线）分布在横轴上下，即不显著异于0，就是不显著，如果上下区间都在横轴上方，则显著异于0，就是显著的意思。

最后是，如果多接受一年政策的影响，行业的发明将会如何变化，课间第二和第三个检验都是在检验这个政策的边际效用，第二个是数量上的，第三个是时间上的：

4. DDD

Ddd就是三重查分的意思，顾名思义就是差中差中差，所以他肯定需要三个交互项来构造三重查分，而大家知道构造交互项的时候不能只放交互项，还要放水平项，所以方程就显得有些繁琐：

这个目的是为了解决其余非观测性因素，例如刚刚提到的德国竞争者的问题，文章中也承认其实从历史数据来看这并不重要，但是我依旧要证明给你看。因此本文引入专利发明国家这一维度，比较美国和除了德国外所有国家在TWEA发案出台前后，以及在受影响行业和不受影响行业的技术发明差异。这里DDD就是在基准DID模型基础上引入USA国别虚拟变量及其与组别虚拟变量treat和处理时间虚拟变量posttwea的交互项。结果显示那些强制许可的行业在美国比除了德国以外的国家平均每年要多生产0.087个技术发明，分年度估计结果显示主要是在1934年以后起作用，进一步支持了基本模型的估计结果。

5. 反事实检验

反事实检验就是人为的构造一个处理组，例如本文中被解释变量成了法国的发明专利，本文选取了在有机化学行业落后的法国为样本，只是将因变量换为法国有机化学相应行业在1875-1939年的专利发明数，重新进行了DID估计。由于法国没有受该法案的影响，该政策效果应该不显著，估计结果支持了该结果，因此证实了该政策确实只作用于美国企业。

结果也符合预期，确实是不显著。

6. IV

正如文中所说“实证策略最大威胁来自于美国企业的许可决定可能不是外生的，即便TWEA政策本身和美国企业的技术引进是外生的”。数据表明美国企业往往选择国内初始技术发明比较弱的行业进行许可，由于反向选择导致的内生性导致OLS结果可能低估强制许可政策的真实效果。因此本文用敌国的专利数做本国专利许可数的IV，进行了2sls估计，证实了OLS相比IV估计确实存在一定程度的下偏。

7. 控制事前时间趋势

虽然前面通过了平行趋势检验，本文仍然担心处理前处理组和参考组可能面临不同时间趋势的影响，继续在基准DID模型基础上加入各行业虚拟变量与时间趋势项的交互，处理变量仍然显著为正，进一步增强了本文的结论。需要说明的是该方法现在常用于包括did在内的面板固定效应模型估计，如果加入交互项，核心变量仍然显著，无疑结果是高度稳健的。

可以看到，比原始方程多了一个treat×t，

8. 控制主行业和时间的联合固定效应

另外一个解决平行趋势问题的方法是在基准DID模型中引入7248个子行业所属的19个主行业的虚拟变量与各年度虚拟变量交互的联合固定效应。注意这里不同于前面用的是7248个子行业，这里是用其上一层的19个主行业。因为对于本文这个7248个子行业*64年的面板数据，控制7248个子行业虚拟变量与时间趋势项只相当于引入了7248个待估系数，模型自由度完全足够。如果这里还是同样引入7248个子行业的虚拟变量和各年度虚拟变量的联合固定效应，这时候会引入7248*64个待估参数，跟样本一样大，如果还考虑其他需要估计的控制变量、子行业固定效应、时间固定效应，模型自由度为负，肯定估计不出，所以这时只有退而求其次，引入上一层主行业与时间交互，这样一来节约了自由度，同时也考虑了随时间和行业同时变化因素的作用，避免了遗漏变量可能导致的时间趋势不一致影响。这个方法在nancy qian发表在aer的一篇关于粮食援助是否会导致冲突的文章也得到了同样运用，该文把130个亚非国家划分为6个区域，控制了区域和年度的联合固定效应以避免遗漏变量的影响。

9. 排除了新创造的行业：排除了在接受其强制许可的专利时还不存在的行业

另外一个可能引起质疑的点在于，很多专利不止被发给一个行业，如何排除行业之间的交叉引用技术的影响？

于是作者只用了19个主行业的数据进行回归，从而避免上述问题。

10. 排除需求冲击：利用靛蓝染料行业

在本文的样本区间内，有可能突然因为某些事件的影响，某一行业的需求大增，市场导向使得这个行业迅速发展从而诞生了很多发明专利，作者为了排除这个因素的影响，利用二战时期由于盟军军装需求的增长，对于靛蓝染料这个行业的需求迅速增长，作者只用靛蓝燃料这个行业进行回归后发现，原结果依然十分稳健。

11. 公司级别的检验

是哪一种强制性许可促进了国内的发明？

是独享的还是大家都有的？

自己独享的机制：首先选择自己较弱的方面进行专利的引进，其次策略性的选择可以与自己的研发完美契合的专利。

其余公司有的专利：通过企业之间的技术溢出和正外部性

于是作者使用了杜邦公司的数据，由于杜邦公司是一个大公司，他牵扯到了很多行业，所以被解释变量是杜邦公司这些年中所有涉及到的行业的发明，这仍然是一个基于行业的面板数据。使用如下回归方程：

事实上看，还是独享的专利对自己的发明创造更有利。

到这里，这篇文章的大体内容也就结束了，did算是一个门槛十分低，运用起来也十分简单的政策评估方法，但是实际上这个方法虽然简单，却面临十分严苛的适用条件，目前国内的研究很多文章在关键部分的交代模棱两可，导致这一方法有滥用的趋势。话说回来，这篇文章很多检验翻来覆去的做，虽然有些繁琐，但是却让我们看到了一个标准、规范的did需要如何去证明其运用的合理性。抛开计量部分，这篇文章的行文包括开头结尾也写得十分精彩，值得大家反复阅读。

此外，这片介绍中的部门内容参阅了王岳龙老师的0338号推文，有兴趣的同学可以去阅读一下。

给推文作者赞赏，我们会全部移交于他，如果你觉得推文作者辛苦或者用心，那就在文后给该作者打赏吧。

此篇文献主持人：西北大学经济管理学院政治经济学专业，硕士二年级，亢延锟（kangyankun@126.com）

写在后面：各位圈友，咱们的计量经济圈社群里面资料和计量咨询都很多，希望大家能够积极加入咱们这个大家庭（戳这里）。之后我们会逐步邀请社群里的圈友再直接建立微信群与圈圈对话，进去之后一定要看“群公告”，不然接收不了群信息。

为了更好地促进计量经济圈成员学习因果推断计量方法，我们决定组建“causal effect”文献学习小组。里面主要是通过学习使用因果推断计量方法的经典文献，那让群里每个成员逐渐理解并掌握因果推断计量方法：treatment effects, RD, DID, DDID, Synthetic control等。