【原】伍德里奇教授大谈计量经济学的现状与未来, 绝对够刺激, 够前沿, 够具启发性！

计量经济圈 2022-05-11 发布于浙江省

展开全文

感谢社群群友＠嘻嘻哈哈投稿

计量经济学的现状与未来：AMA对杰弗里·伍德里奇教授的采访

Jeffrey Wooldridge 教授是密歇根州立大学经济学特聘教授，自 1991 年以来一直在那里任教。他是两本非常受欢迎的计量经济学教科书的作者，《计量经济学导论：现代方法》和《横截面和面板数据的计量经济学分析》 ，分别适用于本科生和研究生课程。世界各地的学生都使用伍德里奇教授的书学习计量经济学。

Wooldridge 教授以其对截面数据和面板数据分析的理论贡献而闻名，他在国际公认的期刊上发表了 70 多篇文章，并在备受推崇的书籍中撰写了几章内容。他的工作获得了许多奖项，包括 Alfred P. Sloan 研究奖学金、计量经济学理论的 Plura Scripsit 奖、应用计量经济学杂志的 Richard Stone 爵士奖以及麻省理工学院的三个年度研究生教师奖。作为国际计量经济学会、计量经济学杂志和国际应用计量经济学协会的会员，Wooldridge 博士曾担任 Journal of Business and Economic Statistics 的编辑和 Economics Letters 的计量经济学联合编辑。Wooldridge 毕业于加州大学圣地亚哥分校，获得经济学博士。

问题 1

拥有这么多年学习和教授计量经济学的经验，你认为人们在学习和使用计量经济学时应该牢记的最重要的原则是什么？最常犯的错误有哪些呢？

伍德里奇教授：

这可能是一个非常宽泛的问题，但我喜欢你问基本概念的方式。我确实认为学生倾向于快速学习测度理论、拓扑学和其他类型的花哨数学，认为这些概念是现代计量经济学的核心。我承认，这些知识对于理论计量经济学的研究可能非常有用，但若要了解基本的计量经济学方法的工作原理，那在概率论基础知识方面下功夫是尤为重要的事情。当然，在概率论基础知识之后，你需要掌握的就是统计学知识了，是不是很简单？！举个例子，关于回归分析的大部分知识，我们都可以在不先查看和了解数据的情况下进行学习——了解如何操作随机变量和随机向量，了解线性投影和条件期望的概念以及如何操作它们。这对线性分析和非线性模型的分析都有很大帮助。

尽管如此，确实需要学习诸如标准极限定理之类的概念，例如大数定律和中心极限定理 (CLT) ，随着这些极限定理而来的是许多操作随机变量和随机向量的方法。对基本概念非常熟悉，从而使这些操作方法成为我们的第二天性，从而能够专注于计量经济学的有趣方面，例如提出新的估计值或将估计值应用于一组有趣的数据，然后真正了解估计值何时会发挥作用，合适不发挥作用。这不需要如此高水平的数学，但它确实需要不断地回顾并确保知道你没有错过任何东西，并在第一次学习这些材料时集中注意力。因为我们有时在对各种方法（哪怕那种被我们熟识的OLS方法）使用背景毫无了解的情况下，就急于进行数据分析。事实上，不怕你笑话，我仍然对这种再熟悉不过的OLS方法有新的见解。

问题2

我们知道计量经济学与统计学或机器学习理论有很多交叉点。你认为计量经济学方法论与其他类似科学的根本区别是什么？你如何定义计量经济学的边界呢？

伍德里奇教授：

这可能是一个有争议的问题，因为有些人认为计量经济学只是统计学的一个子领域。我听到人们甚至质疑为什么计量经济学是一个独立的领域。然而，我们应该，而且大多数人都应该接受过经济学方面的训练。因此，我们应该关注至少在某些经济环境中出现的话题。

现在我确实认为，因为计量经济学是由经济学系的博士来研究的，所以它和经济学非常相似，它真的没有任何界限。如果把计量经济学看作一门学科，可能会显得有些傲慢。然而，我们确实倾向于认为，经济学可以为几乎所有涉及人员、公司、政府机构以及任何涉及到激励和结果的单位之间相互作用的问题的分析带来一些新东西。

因此，这种态度也蔓延到了计量经济学中（实际上，我们并不认为在数据分析中有很多界限）。一个很好的例子，是过去十年间机器学习与计量经济学中因果推断的融合。机器学习方法始于统计学，主要用于预测。计量经济学家已经想出了如何修改这些方法并将它们用于因果推断，也就是大家熟知的机器学习在因果推断中的应用议题。我并不觉得某些学术委员会认为这已经超出了经济学或计量经济学的研究边界。计量经济学家只是说，”看，我们对因果分析中的政策干预效果的估计很感兴趣，这是这些工具可以应用的场所和方式。”

我并没有真正看到应用计量经济学的边界。你不妨选择TOP5期刊之一或查看顶级领域期刊浏览一下。然后，你会看到在这些经济学期刊上出现了从犯罪到健康问题的各种主题，在多数情况下，我们都倾向于认为这些是流行病学家或刑事司法人员研究的内容。然而，经济学家参与了所有这些工作。看看在评估冠状病毒的影响时发生了什么。经济学家参与了很多，并试图弄清楚经济成本是多少，甚至包括病毒的心理成本是多少，封锁等措施的有效性等等。因此，我认为经济学家和计量经济学家之间没有太多界限。

问题 3

除了传统的基于样本（sample-based）的不确定性之外，你最近的计量经济学论文 （Abadie et al. 2020） 还讨论了将回归中的标准误差解释为基于设计（design-based）的不确定性的另一种方法（基于模型还是基于设计的实证方法? 诺奖候选人给你的insights！）。你能详细介绍一下这篇论文吗？这个结果对实证研究人员意味着什么？正如论文中所建议的那样，我们什么时候应该以基于设计的方式解释标准误？

伍德里奇教授：

谢谢问这个问题。我们仍在共同研究这篇论文，将最初的工作扩展到可能必须对标准误差进行聚类以考虑集群抽样或基于设计本身的一些聚类（处理组和控制组的分配）。然后意识到，我们实际上并没有完全理解非聚类的情况，也就是我们随机抽取样本的情况。

有时，学生会说，“你教我们如何分析普通最小二乘法，从总体中随机抽样的角度来分析渐近性质，但是如果你能观察到整个总体那会发生什么？”，这是一个很好的问题，因为我们经常这样做，尤其是在县级（例如县、省）的汇总数据中。你能够看到他们所有总体。

此时，当你使用普通最小二乘法 (OLS) 等任何一种计量经济学方法时，如何解释报告的标准误？我们决定尝试弥合这一不足。基于设计的方法有着悠久的历史，统计学家多年前就参与其中，并考虑拥有总体数据的情形。没有抽样，但你所拥有的是在控制状态和处理状态下都有的潜在结果。然后，所有的不确定性都来自于将各个单元分配给控制组或处理组。

现在，随机性来自于我们只观察到某个状态下的每个单元的情况（要么处理状态，要么控制状态，不可能同时观察到两种状态）。我们分配处理机制的方式是随机的，即该个体是否受到政策处理是外生决定的。我的书非常关注随机抽样案例，因此很自然地尝试提出一个将这两者结合在一起的框架。该框架提供了从从大量总体中随机抽样的情况到没有抽样的情况（此时，你能观察到整个总体）的平稳过渡。我们设法提出了一个涵盖所有这些情况的公式。你可以清楚地看到恰当方差的公式取决于你观察到的总体的比例。

由此得出的重要见解之一是，如果你能观察到整个总体，并使用常见的标准误，就显得很保守，此时你的置信区间就比一般情况下的要宽。在某些情况下，当人们之间的影响没有潜在的异质性时，常见的标准误不会显得保守。在某些情况下，通常的异方差稳健标准误，即所谓的 Eicker-Huber-White 标准误是正确的。但总的来说，EHW标准误还是显得有些保守。因此，至少就目前而言，如果你拥有整个总体数据，那么你使用的是还是保守标准误。

关于标准误，参看：1.什么时候以及如何使用聚类标准误？在什么层级上进行聚类呢？2.面板数据中标准误的估计方法, 你确定用对了吗? 我们来比较一番！3.回归标准误比R2更好，在拟合优度度量方面，4.在什么级别上标准误聚类, 个体, 县, 省或行业, 时间？

实际上，我们在那篇论文中有一些没有被广泛应用的东西，那就是当你观察到整个总体或大部分总体时，有一种方法合理有效的方式可以调整你的标准误差以使其更小。我们那篇论文准确地展示了调整标准误的工作原理，这非常简单。一旦有人在 Stata 中编程，我希望它会被经常使用。此外，基于使用分层抽样文献中的公式，现在有一些简单的技巧可以使用它，这在统计学中也有较长的历史了。所有这些研究都涉及到许多不同的领域，并且变得越来越具有跨学科性质。

问题 4

在过去的几年里，你做了很多工作来提高我们对一些广泛使用的计量经济学模型的认识，包括工具变量法、双重差分法和处理效应（Słoczyński 和 Wooldridge 2018；Wooldridge 2019；Wooldridge 2021）。你认为这些新发现将如何影响实证研究人员应用这些模型的方式？我们应该在哪些场景下应用这些新模型？更一般地说，你认为实证研究人员应该如何了解最新的计量经济学方法？

伍德里奇教授：

当然，我希望经验丰富的人会经常使用我的研究。你提到了一些我一直在研究的主题也是我会继续研究的主题。

最近通过将传统处理效应与双重差分法相结合而变得非常有用的方法之一，是所谓的双重稳健估计（doubly robust estimators）。我在 15 年前就开始从事这项工作，并于 2007 年在Journal of Econometrics杂志 (Wooldridge，2007) 上发表了一篇论文，提出了一种特殊的双重稳健估计值（1.前沿: 双重稳健DID, 给你的DID加一把锁！2.因果效应中的双重稳健估计值, 让你的估计精准少误）。如果你要估计处理效应，通常有两种方法。也许不止两种，但我会专注于两种。你可以使用回归调整（regression adjustment，TOP5刊如何使用处理效应估计方法, 回归调整, 逆倾向得分加权和双重稳健估计），这意味着你为结果变量的条件均值估计模型；你也可以使用一些倾向得分方法（propensity score method，1.如何正确使用PSM倾向得分匹配, 来自top英文期刊上的分析与总结！2.在双重差分模型中使用倾向得分估计政策变化效应操作及注意事项! 附100篇相关文章! 3.广义倾向得分匹配GPSM实证数据, 代码和相关解读结果公开！4.面板数据中的倾向得分匹配PSM, 附详细程序和操作思路），这意味着你可以为处理变量估计一个模型。众所周知，你也可以将这两者结合起来，得出一个具有双重稳健性的估计值。这个名称可能不太正确，但这意味着只需让两个模型中的一个正确，就能一致地估计出平均处理效应。尽管这是在截面数据分析的背景下得出的估计方法，但事实证明它已经被其他研究人员注意到了并被应用到其他种类的数据中。我正在做的事情是，当你在政策干预中有双重差分设计时，也可以将这种双重稳健方法应用于面板数据分析中。你有政策前后的数据，有一个控制组和一个处理组，事实证明，可以将其应用于具有交错设计的相当复杂的数据结构中。

你提到了双重差分法的工作，那现在就转到我实际写的相关内容。我最近对双向固定效应的批评的解释是，这不是对估计值的批评，而是对模型本身的批评。该模型假设单一处理效应，而无论有多少出生队列以及干预的时间段有多长。我只是指出，如果你设置得当，可以应用回归方法来估计一个更灵活的模型，这在很大程度上克服了对简单的双向固定效应分析的批评。

因此，我向学生强调的是，将模型和估计方法的概念分开是非常重要的。我有时候也会忘记区分这两者。我会说 OLS 模型之类的东西，但 OLS 不是模型。这是一种我们可以应用于各种模型的估计方法。我们需要发挥创造力并使用拥有的工具，以便将这些方法应用于不做强假设的模型。我希望这个想法能再次连接起当前我的很多简单研究。试图找到更简单的方法来进行更灵活的分析，但实际上这又是异常困难的。

问题 5

在你的社交媒体上，你批评机器学习就是在不断进行模拟直到寻找到新的估计值为止（这个新估计值看起来明显优于现有估计值）。能否详细说明你对机器学习和其他高维方法如何进行改进，从而为经济学和计量经济学领域做出贡献？

伍德里奇教授：

在社交媒体上发帖与真正写一篇严肃的研究论文有点不同。当然，我在那里开了个玩笑，因为最近正为一直在研究的一些非线性双重差分方法进行一些模拟。但后来我又在想，当在做模拟和改变模拟的参数时，我这样做是为了比较这个估计值与其他估计值的优劣，还是我试图想去操纵它从而让我的估计值看起来更好？所以，我真的只是在发表声明。就像你知道的那样，希望自己成为最好的人是人的本性，难道不对吗？有人使用机器来了解这一点，而我是在发表声明，我试图通过展示我所提出的方法能得到更好的效果的案例，来尽可能客观地展示用其他方法得到效果更好的案例。

不过，它与机器学习并非完全无关。当我们发表论文时，让你的作品发表的最佳方式是证明它比现有方法更有效。由于编写理论和推导方法的人与进行模拟的人恰恰又是相同的，因此将来如果做方法的与做模拟的人进一步的脱钩可能会更好。我们现在有一些评估这些方法的客观方法。如果某件事变得足够流行，其他人就会对其优劣进行评估。但我认为仍然需要模拟来了解某些事物在现实世界中的运作方式。

我一直认为我们应该有更多的比赛，比如盲人比赛，参加的人不知道真相是什么。他们在一堆不同的场景中应用他们最喜欢的方法，因此我们可以评估不同方法的效果。我猜机器学习会很好地解决这个问题，但这只是一个我个人的印象。我相信使用基本方法且具有良好直觉和创造性的人一定能够做得很好。

这确实引发了机器学习及其未来发展的系列问题。我相信你已经在数据分析中看到了相当数量的问题。我认为将机器学习方法应用于因果推断的工作保证了它将在计量经济学和其他使用数据分析的领域拥有悠久的历史。当我访问亚马逊、谷歌时，他们都在大量地使用机器学习方法。当然，这也不是什么秘密。这些公司从事赚取利润的业务，他们不会采用不适合他们利润最大化的方法。所以，我认为市场肯定会在这方面给出选择和说法。若是出于预测目的，机器学习方法似乎工作得很好。

关于机器学习，参看1.机器学习之KNN分类算法介绍: Stata和R同步实现（附数据和代码），2.机器学习对经济学研究的影响研究进展综述，3.回顾与展望经济学研究中的机器学习，4.最新: 运用机器学习和合成控制法研究武汉封城对空气污染和健康的影响! 5.Top, 机器学习是一种应用的计量经济学方法, 不懂将来面临淘汰危险！6.Top前沿: 农业和应用经济学中的机器学习, 其与计量经济学的比较, 不读不懂你就out了！7.前沿: 机器学习在金融和能源经济领域的应用分类总结，8.机器学习方法出现在AER, JPE, QJE等顶刊上了！9.机器学习第一书, 数据挖掘, 推理和预测，10.从线性回归到机器学习, 一张图帮你文献综述，11.11种与机器学习相关的多元变量分析方法汇总，12.机器学习和大数据计量经济学, 你必须阅读一下这篇，13.机器学习与Econometrics的书籍推荐, 值得拥有的经典，14.机器学习在微观计量的应用最新趋势: 大数据和因果推断，15.R语言函数最全总结, 机器学习从这里出发，16.机器学习在微观计量的应用最新趋势: 回归模型，17.机器学习对计量经济学的影响, AEA年会独家报道，18.回归、分类与聚类：三大方向剖解机器学习算法的优缺点（附Python和R实现），19.关于机器学习的领悟与反思，20.机器学习，可异于数理统计，21.前沿: 比特币, 多少罪恶假汝之手? 机器学习测算加密货币资助的非法活动金额! 22.利用机器学习进行实证资产定价, 金融投资的前沿科学技术! 23.全面比较和概述运用机器学习模型进行时间序列预测的方法优劣！24.用合成控制法, 机器学习和面板数据模型开展政策评估的论文！25.更精确的因果效应识别: 基于机器学习的视角，26.一本最新因果推断书籍, 包括了机器学习因果推断方法, 学习主流和前沿方法，27.如何用机器学习在中国股市赚钱呢? 顶刊文章告诉你方法！28.机器学习和经济学, 技术革命正在改变经济社会和学术研究，29.世界计量经济学院士新作“大数据和机器学习对计量建模与统计推断的挑战与机遇”，30.机器学习已经与政策评估方法, 例如事件研究法结合起来识别政策因果效应了！31.重磅! 汉森教授又修订了风靡世界的“计量经济学”教材, 为博士生们增加了DID, RDD, 机器学习等全新内容！32.几张有趣的图片, 各种类型的经济学, 机器学习, 科学论文像什么样子？33.机器学习已经用于微观数据调查和构建指标了, 比较前沿！34.因果机器学习的前沿进展综述

思考

Luyao Zhang：

是的，听起来很有趣！Wooldridge 教授指出了机器学习中有希望的方向，从预测到寻找更多科学结果。你可以进行机器学习和因果推断。 Zichao和Yufan都是数据科学专业的，所以很高兴听到他们的评论，尤其是关于计量经济学和机器学习的评论。

Yufang：

作为一名数据科学专业的学生，Wooldridge 教授关于机器学习的观点引起了我的共鸣。越是研究一些先进的机器学习模型，尤其是深度学习模型，越觉得不科学。今天许多新提出的模型都非常实用且性能良好，但也非常复杂。研究人员所做的大部分工作只是尝试不同的模型，例如在模型中添加不同的模块。如果一种结构的结果不起作用，他们就会尝试另一种。所以我认为这确实是整个机器学习，尤其是深度学习现在面临的问题。

伍德里奇教授：

这是一个很好的观察。由于我只涉足了一点机器学习，没有你那般有关于人们如何使用它和进步的相关经验。可能在最后，它就像其他计量经济学方法一样，人们尝试了很多不同的事情，但只报告他们想要的结果。因此，也许机器学习并没有像我们被引导相信的那样使大家摆脱这种困境。只是为了跟进这一点，我已经看到很多论文直接跳进了非常复杂和困难的情形中。换句话说，有一些简单的方法可以做因果推断之类的事情。例如，人们可以用工具变量估计因果效应，而不是完全进入机器学习黑匣子。如果人们尝试更容易理解的事情，然后看看更困难的事情是否会产生类似的答案，那就太好了。

Zichao：

世界正在迅速变化。随着区块链和其他许多信息技术的出现，经济学中的问题变得越来越复杂。你认为计量经济学的发展趋势是什么？

伍德里奇教授：

这对我来说是一个非常有趣且非常棘手的问题。有趣的是，如果你查看有关干预分析（intervention analysis）和双重差分法的文献，在某些方面我们正试图回到更简单的事情上。所以，如果你将今天与 20 年前进行比较，看看人们在做什么计量经济学，在我看来，由于双重差分法的出现，结构估计方法（structural estimations，1.封城的经济代价有多高? 宋铮等用交叠DID, 事件研究法, 结构估计, 引力模型测度，2.阿里巴巴效应: 结构模型与简约估计结合的典范）现在可能比 15 年前更不受欢迎。似乎我们一直在寻找自然实验和干预措施来评估政策的效应。

如果你有一个讲座，而且标题中有个双重差分方法，或者你提供了关于双重差分的短期课程，马上就会获得相当多的报名人数。但是，如果你在提供一门关于产业组织中的结构计量经济学方法的课程，尽管该方法和课程很重要，但它的受众却少得可怜。所以，我想知道在现实世界中对这些复杂问题的反应，是否会导致计量经济学在不断被简化。或者，至少我们将只相信那些有明确方法来确定干预的因果效应的分析，而不是我们相对简单的经济学理论模型。

Interviewee: Prof. Jeffrey Wooldridge

Interviewer: Prof. Luyao Zhang, William Zhao

Discussants: Zichao Chen, Yufan Zhang

Executive Editors: Xinyu Tian, Ray Zhu

Chief Editor: Prof. Luyao Zhang

Source: https:///sciecon-ama/the-current-and-future-of-econometrics-ed30569e7edd

关于因果推断书籍：①哈佛大学新修订完成的因果推断经典大作免费下载！附数据和code！②图灵奖得主Pearl的因果推断新科学, Why?③计量课程免费开放！面板数据, 因果推断, 时间序列分析与Stata应用，④你应该阅读哪本因果推断书籍: 一份进阶流程图和简短书评列表。

下面这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。

3.5年，计量经济圈近1000篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

计量经济圈组织了一个计量社群，有如下特征：热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此，建议积极进取和有强烈研习激情的中青年学者到社群交流探讨，始终坚信优秀是通过感染优秀而互相成就彼此的。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：计量经济圈 > 《待分类》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

计量经济圈

关注对话

TA的最新馆藏

诺奖科斯: 如果你不断地‘拷打逼问’数据，连上帝也会屈服的
(修订)审稿人: 在DID后还必须用IV再做一下, X的滞后项做IV真的太low了
在被判死刑后, 1区经济学SSCI刊给出了中间影响机制检验的建议！
TOP刊主编: 会计学术研究快被处死了, 已失去研究的意义, 为什么呢, 怎么办？
宝贵! 几十种内生性处理方法使用要求和区别的宝典和文献
因果推断宝典:内生性问题解决之道, 精选书单与文献大汇总！

喜欢该文的人也喜欢更多

热门阅读换一换