分享

如何写好经济学实证论文?

 湖经松哥 2022-10-29 发布于湖北
来源:学说平台

作者:任雨祺,Via


图片

教授介绍:江艇,香港科技大学商学院经济学博士,中国人民大学经济学院经济学副教授,美国哥伦比亚大学商学院访问学者,人大国家发展与战略研究院研究员,人大微观数据与实证方法研究中心副主任,中国人民大学企业与组织研究中心研究员。

01 研究论文的基本结构

在导论中要写清楚以下四个方面的内容。

1. 明确的表述研究的问题是什么,或者要检验的假说是什么。

2. 为什么要关心这个问题?是因为这个问题是还没有被检验的结论,还是这个问题理论上可能存在着互相竞争的力量,那么实证呈现出的结果最终需要有数据来回答,或者说这个问题是一个非常重要的政策问题。

所以在 motivation部分有必要引述一下前人的文献,但必须要把导论部分对文献的引述和文献综述部分的引述区分开来,而且必须要简短。

3. 要开宗明义的讲清楚文章的贡献,使用的研究情境、数据、识别和策略。那么在介绍自己文章贡献的时候,要谨慎的去使用一些大词,比如,文章填补的空白、是开创性的贡献等。

但在这里一定要实事求是,没有必要过低的估计自己,也不要过高的去包装自己。过高的包装有可能是因为你对整个文献了解的不是特别全面,过高的说法可能是露怯,审稿人看到你这样的词汇相当于是在变相的打他的脸。

4. 主要结果,不但要表述自己的结果,还要简要的去解释这些结果和前人结果的差异,以及这些结果的理论含义、政策含义。


经典论文案例1

Title:The potato's contribution to population and urbanization:Evidence from a historical experiment

作者:

Nathan Nunn 哈佛大学经济学教授

钱楠筠(Nancy Qian)复旦大学泛海国际金融学院经济学特聘教授

Abstract:We exploit regional variation in suitability for cultivating potatoes,together with time variation arising from their introduction to the Old World from the Americas,to estimate the impact of potatoes on Old World population and urbanization. Our results show that the introduction of the potato was re- sponsible for a significant portion of the increase in population and urbaniza- tion observed during the eighteenth and nineteenth centuries.According to our most conservative estimates, the introduction of the potato accounts for approx- imately one-quarter of the growth in Old World population and urbanization between 1700 and 1900.Additional evidence from within-country comparisons of city populations and adult heights also confirms the cross-country findings.

相关阅读:

DID小公主的成名作!消失的女性和中国茶叶的价格


这是一篇经济史论文,文章的题目叫做《土豆对人口和城市化的贡献:来自历史实验的证据》,土豆是一个美洲大陆的作物,由于土豆是种植非常容易、营养价值、营养成分也比较高的食物,所以对旧大陆的人口增长和城市化水平的提高都做出了非常重要的贡献。


这样的一个观察实际上是历史学家做出来的,这篇论文的目的就是通过数据验证对历史的观察。作者采用的是双重差分法(DID),我们知道,双重差分法首先需要有一个事件前与事件后的比较,另外还要有处理组和控制组的比较。

农作物土豆从新大陆引进到旧大陆的时间比较久远,所以没有办法精确的找出究竟是哪个地区在哪个时点引入的,所以没有引入时点上的差异性。此时应当去构造处理组和控制组,虽然在同一时点上都受到了“政策的冲击”,但政策冲击的强度可能是不一样的。

论文的两个作者就想到用怎样的政策强度、指标去刻画受到政策冲击的强度。不同地区土地土壤的性质决定了他们种植土豆的适宜程度是不一样的,这种横截面的变动性,再结合时间层面的变动性,用这两个变动性的交互去估计土豆对旧大陆的人口和城市化的影响,研究结果发现土豆确实会显著提高人口水平和城市化水平。

这篇文章的导论是一个非常有学习价值的范例。文章交代问题以后,马上讲这个问题的挑战在哪里,贡献是怎样,是通过什么样的方法去解决挑战的,这种解决的本质是什么,这种本质的优点是什么、缺点是什么。肯定也依赖于假设,但假设必须要非常明确的向读者展示出来。

02 文献综述

文献综述部分,不是参考文献越长越好,一定要跟研究特别相关的。评述的时候要评述跟本文直接相关的前沿研究,也能够更好的帮你去找审稿人,找一个了解且熟悉这个话题的。

当然,这也是个双刃剑,如果本身对这个领域不是特别熟悉的,你掉到一个很熟悉此类方向的审稿人手里下场就很惨。但是总的来说这是一个好事情,即使不被杂志所录用,对这个领域非常熟悉的审稿人也能够很好的提出相关意见,如果能拿一份高质量的审稿意见,其实对我们帮助也很大。

在这个部分要重点讲自己的研究与前人研究的差异,论文是否使用了新数据、更稳健的模型、新的识别策略,或者是不是回答了一个更一般性的问题、一个更具体的问题,有差异的方向是我们为学术的大厦提供一块新的经验研究的砖石。

03 理论框架

理论框架需要给出文章所研究问题的基本行为假设、信息假设、制度假设,而且要讨论文章的结果在何种程度上依赖于这些假设。但理论框架不必是一个正式的梳理模型,如果这些假设、机制、结论都可以用文字清楚的描述,就不需要梳理模型了。

一个正式的模型可以判断文章的外部有效性,如果确实有必要构造梳理模型,也尽量要从简单的模型开始。即使是这样,一个简单的模型设定也必须要跟后面的计量模型有所联系,例如,在这个理论模型中写了最后得出了一些结论,如比较静态分析的结论,但跟后面的计量分析回归模型完全是脱节的,就会让人反感。

如果决定要去构造一个正式的梳理模型的话,往往需要交代一下梳理模型部分和实证研究部分、回归分析部分、与计量策略之间的联系和差异。

04 数据

数据需要写讲清楚两个方面。

一方面,交代数据的来源、样本期、结构,是一个横截面数据还是混合横截面数据,时间序列数据还是面板数据。包括当前的样本容量,观测单位的含义是一个个体、家庭、地区还是省份,有的时候你的观测单位可能是行业,如这个地区的某一个行业的垄断程度受到什么东西的影响,此时观测单位就是一个地区的行业。

另一方面,交代数据的局限性,数据是否有关键变量是缺失的。所以要去寻找代理变量。是否存在样本缺失的情况,是否有潜在的样本。这些重要的局限性可能是后文稳健性检验或者证伪检验的出发点。在思考研究问题时,要想一下理想的数据是什么,实际有的是什么样的数据,这可以帮助你更好的组织结构。

此外,要提供数据的描述性统计,比如,分组报告处理,变量的命令尽量一目了然,这将非常影响读者的观感。数据描述的作用是展示数据变动性及数据来源。

经典论文案例2

Title:Minimum Wages and Employment: A Case Study of the Fast-Food Industry in New Jersey and Pennsylvania

作者:

David Card 加州大学伯克利分校教授,2021年诺贝尔经济学奖得主

Alan B.Krueger 普林斯顿大学教授,白宫经济顾问委员会主席候选人

Abstract:On April 1, 1992,New Jersey's minimum wage rose from $4.25 to $5.05 per hour.To evaluate the impact of the law we surveyed 410 fast-food restaurants in New Jersey and eastern Pennsylvania before and after the rise. Comparisons of employment growth at stores in New Jersey and Pennsylvania (where the minimum wage was constant) provide simple estimates of the effect of the higher minimum wage. We also compare employment changes at stores in New Jersey that were initially paying high wages (above $5) to the changes at lower-wage stores. We find no indication that the rise in the minimum wage reduced employment.

相关阅读:

干货!经济学诺奖采访精彩实录,专家点评,112篇顶刊发表合集


这是David Card和Alan B.Krueger 1994年发表的一篇双重差分领域的经典的、开创性的论文。文章研究了最低工资对就业的影响,传统结论认为最低工资可能会导致失业,减少员工的雇佣。

作者用美国新泽西州和宾夕法尼亚州的快餐店做了case study,研究结果发现,最低工资的上涨使得新泽西州在事前和事后的快餐店就业数量的变化与没有政策冲击的宾夕法尼亚州在事前和事后的就业数量的变化是没有差异的。

这篇文章后续引发了很多的后续研究和学术的论战,在文章里面有这样一张表格——工资分布的直方图。

图片

这样放图可以反映非常多的信息,隐含着识别假设的合理性。

数据描述的作用是展示组间的平衡性。仍然以这篇文章为例,对于观测性研究来说,这种逐渐平衡性的展示也非常重要,比如,用匹配的方法去做研究,分处理组和控制组、事前和事后来比较。不同品牌的快餐店比例大致在两周之间是相当的,事前的就业在处理组是20.4,在控制组是23.3,事后的就业在处理组是21,控制组是21.2。

这样一个非常简单的比较,实际上故事就已经呼之欲出了,控制组的就业有明显的下降,但处理组的就业不但没有下降,反而有略微的上升。即最低工资的出台其实并没有降低失业,硬要说的话可能反而还有细微的增加,并没有增加失业,可能反而还增加就业。

如果你是作者,那么你应当预见或者引导读者产生什么样的疑问,比如说在某种统计表里面,提示读者要去关注某些数值。

05 计量模型

首先,要写出基本的计量方程设定,清晰的表述变量、参数的含义,要不厌其烦的说明参数表达是什么,如相对复杂的模型、多项式模型、交互项模型,特别要注意数据的变动性来源、层级,数据的层级是被解释变量和解释变量,很可能层级是不一样的。这决定了研究所真正依赖的识别、变动性的来源是什么,越是高水平的文章在这方面做得越好的。

到数据很复杂的时候,固定效应是为你的识别服务的,要清楚的表达清楚控制的固定效应是要解决哪一类的遗漏变量平衡。

其次,要阐述识别策略,是控制回归、匹配的方法、双重差分、合成控制、工具变量,还是回归单点设计等。

最后,要写出进一步的估计和检验形式,讨论其必要性。写在文章里面的每一字每一句,包括描述性统计表、分组回归,都是为了加强因果推断的论证服务。

06 结果

结果表述中要做到以下几点:

1. 层层递进,先报告基本结果再报告进一步的识别。顺序没有一定之规,摆放位置要灵活处理,而处理的前提是首先要知道稳健性检验是在干什么,是服务于什么样特定目的。如果已经明确知道了它服务于某些特定的目的,你就去揣摩读者,你最希望读者在什么时候看到稳定情景。

2. 控制变量。因为控制了变量以后,这个工具变量才变得更加可信。每一张表格都要交代清楚被解释变量、核心解释变量、控制变量、估计方式、估计方法、标准物的形式等,所以我们看到表格下面有大量的注释,注释千万不要省。尽量要做到每一张表格的信息都是自洽的。要重点讨论核心解释变量的估计结果,但不要过度阐释控制变量的估值。

3. 不但要解释系数、估计的统计显著性,还要解释它的经济显著性。一个不显著的结果也看你如何去表述,很多同学看到不理想的结果,失望之情溢于纸面,但是会写文章的同学会说,我们发现这个结果没有信心、不显著,但是系数估计值很大,说明因果效应是很大的,只是我对他们估计的比较粗糙。


很多时候为什么很重要的文章要精读,不是说学到了他的数据、回馈技术。要去看作者为什么在此时讲这句话,他是如何去为消极的结论做辩护的,如何把一个消极的结论尽量变成支持他的结论的。

07 结论

结论部分可以概述本文的结论,讨论研究结论的局限性以及它未来的扩展方向。不能把一个真的非常有现实可能性的扩展放到结论里面去讲,理由很简单,如果你已经知道你下一篇要做什么,不要提前告诉人家,你自己默默的做就好。这里面讲的局限性和未来的扩展方向基本上是比较泛泛的。此外,还可以以相对不正式的方式去推测结论的可能含义。

08 注意事项

1.文章中间的任何实质性的论断都必须要有出处,哪怕有一些你认为是非常显然的。

2.写作一定要突出主线,有的时候结果太多了可能反而是坏事。

3.不是所有的回归结果都要做成表格放到正文中,有的结果我们可以在正文中用文字来表述。

4.不要轻易放弃不显著的结果。

5.一些实证方法它是有固定的程式,比如说工具变量要同时展示OLS的结果等。

6.细节交代必须要清楚。大量的文章不说匹配是怎么做的,所以整个就是一个黑箱匹配。涉及到匹配、估计样本的构造,是怎么构造、怎么匹配的、用哪些变量匹配的,一定要交代清楚。

7.写学术八股文而不是小说,要开门见山要直截了当,不要千回百转。埋了一个伏笔,等到第八部分我再告诉你,不要这样,读者早就弃文了。

本文整理自中国人民大学经济学院副教授江艇在首都经济贸易大学主办的“学术训练营:实证分析结果解读与呈现”。文章未经本人审核,仅供参考。


图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多