分享

科研小白到顶刊大佬的晋级之路——避坑篇

 湖经松哥 2022-10-05 发布于湖北
图片
Hello!
这是你与「大学生科研竞赛」的第 790 次相遇。

又到一年保研季,22年保研可谓是“龙争虎斗”,往年以“绩点为王”的说法好像不在合适,论文、竞赛等在申请或面试都占据重要作用。

看了很多经验帖,听了很多优秀学长学姐的讲座分享,虽然成功的案例各不相同,但不可否认的是大多数大佬都会有至少一篇可以拿得出手用于申请以及面试的论文。

图片

(图源网络)

虽然对于新手小白来说想很快写出一篇高质量论文很难,但如果肯下功夫,在日常生活中就开始培养了基本的研究素养,加上坚持阅读优秀文献、虚心请教老以及不断尝试。重要的是心态稳、多积累、少踩坑,才是成功通关的秘钥。

小竞在此给大家罗列了一些论文路上常见但千万不能踩的坑吧~

01

实验数据样本量过少





确定论文方向与选题之后,数据将是同学们在科研之路上碰到的第一个关卡。虽然有很多大家熟知的数据库可以为大家提供数据来源,但是可千万别小瞧数据选择和处理这一步。

作为一篇科研论文的输入,数据对于最终的论文结果与质量起着至关重要的作用。毕竟,缺少优质的输入,怎么可能获得优质的输出呢?

图片
(图源网络)

数据的选择

就国内而言,宏观经济研究主要选择年鉴以及宏观数据库等,而微观经济研究更常采用资本市场上的各公司财务数据,这些数据通常比较完整可靠,一致性与连续性也相对有所保障。

不过,在实际操作中可能会面临实验数据样本量过少的问题,比如部分指标仅从某一年份起开始披露、研究非上市企业等难以收集足够多样本数据等。过小的样本范围和时间跨度都会导致样本缺乏足够的代表性,进而会影响实证结果,降低研究的可靠性。

如果遇到这样的问题,同学们就需要重新考虑一下指标变量的选取、或是研究对象的选择,尽量将未来可能出现的错误扼杀在襁褓之中。

02

考虑特殊样本





当同学们所研究的经济问题在某些样本中具有特殊性时,就要在实证分析前考虑对这些特殊样本进行剔除。

比如,在考察政治联系对企业债务融资的影响时,不少文献会将“北京”地区的企业样本予以剔除,其实就是因为北京属于中国的政治中心,相对其他城市而言具有特殊性。

又如,在考察新冠肺炎疫情对企业投资发展影响时,常常需要考虑湖北是此次疫情的重灾区,影响可能更突出,因此需要将“湖北”地区的企业样本予以剔除。其实,我们常见的对于金融企业、ST企业进行剔除也是出于同样的逻辑。

03

内生性问题





解决好数据样本问题,就要开始对选定的变量进行研究啦。在经济问题的研究中,研究因果问题时需要特别关注模型的内生性问题。

我们常说的内生性问题,其实就是指模型中的一个或多个解释变量与误差项存在相关关系。通常,在一般模型中,被解释变量应该是内生的,而解释变量应该是外生的,也就是说解释变量的取值是不应该被模型所决定的。而内生性问题一旦发生,就意味着解释变量不是完全外生了。

这种内生性问题会带来什么可怕的后果呢?

事实上,绝大部分研究都建立在参数估计的“一致性”上,也就是说当样本量足够大时,样本估计出的参数会无限趋近于总体的真实参数。而一旦内生性问题出现,参数估计的“一致性”就会被破坏,同学们用样本估计出的参数就失去了参考价值。

一般来说,内生性问题的产生主要与以下几种情况有关:

1)遗漏变量,且遗漏变量与引入模型的其他变量相关;
2)解释变量和被解释变量相互作用,相互影响,互为因果;
3)自我选择偏误;
4)样本选择偏误。

目前,在研究领域,有多种已较为成熟的方法可以用来解决模型内生性问题,如工具变量法、Heckman二阶段模型考察、自然实验法、双重差分法等。

总之,内生性问题是我们需要重点考虑的问题之一,尤其最好可以在收集数据前就运用经济理论进行考虑。

04

多重共线性问题





除了内生性问题,多重共线性问题也尤其需要考虑。所谓多重共线性,就是指线性回归模型中的解释变量间存在精确相关关系或高度相关关系,进而导致模型估计失真或难以估计准确。

一般来说,经济数据的限制可能会导致模型设计不当,进而导致设计矩阵中解释变量间存在普遍的相关关系,即存在一定程度上的共线性(近似共线性),尤其是调节变量的交叉项常常出现这种问题。

多重共线性问题的产生主要有以下原因

1)经济变量相关的共同趋势;
2)滞后变量的引入;
3)样本资料的限制。

目前主要采用特征分析法、条件数法、和方差扩大因子法等判断回归模型的复共线性及其严重程度,并采用差分法、岭回归法、简单相关系数检验法等来解决。

如果不对多重共线性问题加以考虑,就可能会导致以下问题:

1)完全共线性下参数估计量不存在;
2)近似共线性下OLS估计量非有效;
3)参数估计量经济含义不合理;
4)变量的显著性检验失去意义,可能将重要的解释变量排除在模型之外;
5)模型的预测功能失效,方差变大可能使区间预测的区间变大,使预测失去意义。

总之,多重共线性问题在实证分析过程比较常见,需要同学们注意避坑,尤其是当遇到调节交叉项时更要加倍谨慎!

05

稳健性问题





最后,在进行实证分析得出结果后,最后一步需要关注的就是研究的稳健性问题。

其实,稳健性检验就是对所得结论的进一步考察验证,在使用某个样本得出结论后,再通过变换其他研究样本进行检验分析,从而进一步夯实结论。如果当改变了一些条件或者假设发现所得结论依然不变,那么结论就是稳健的;反之,结论则有待商榷,需要找出使结论发生改变的原因并进行解释。

对于稳健性问题的考虑可以有效排除其他理论依据或假说,并在后期投稿时避免审稿人提出质疑。根据小竞的经验,缺少稳健性检验的文章可是常常会被审稿人退回的哦。


在小竞带大家了解论文写作需要格外关注的“五大坑”后,剩下的就要靠同学们的日常积累与沉淀啦。时常锻炼自己的研究思维,并在品读学术大牛们研究论文的过程中归纳总结、积累问题处理经验,小竞相信各位优秀的同学们一定可以成功通关的!

在此,小竞推荐大家阅读一些中英文顶级期刊,这样同学们就可以从优秀的研究中广泛借鉴思路和逻辑,最终形成自己的研究视角。

√ 中文顶级期刊:
《经济研究》、《中国社会科学》、《经济学(季刊)》、《中国工业经济》、《管理世界》、《金融研究》等。

√ 英文顶级期刊:
American Economic Review,
Econometrica, 
Journal of Political Economy, 
Quarterly Journal of Economics, Review of Economic Studies等。

另外,对于研究刚刚入门的同学们,小竞大力推荐陈强老师的《高级计量经济学及Stata应用》这本书。同学们在研究中遇到任何问题也可以在B站进行搜索,B站上有很多优质的up主有过系列的研究问题讲解以及stata实现代码。

最后,小竞祝大家早日摆脱ddl困扰,产出优质论文成为顶刊大佬!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多