来源:刘西川阅读写作课 在计量回归分析过程中,核心自变量的估计系数不显著,怎么办?在一些推文(如:微信公众号“经管定量笔记”推送的“在因果关系研究中,回归系数不显著怎么办?有以下解决思路”)中,推荐了一些解决思路,例如选方程、选变量、选样本、选方法、缺失值处理等。 一般来说,做回归分析,遇到核心自变量不显著是常事。在指导学生论文写作的过程中,我发现确实有学生困惑于如何处理不显著问题。在这里,我想谈一下自己对不显著这个问题的看法和思考。 面对回归结果不显著,我的第一反应不是想办法把不显著调成显著。当核心变量回归结果不显著、不符合理论预期时,我们应该做的是全面审视自己的研究工作。 第一个需要审视的是自己对理论假说的信念。在估计结果不显著的现实出现后,之前所提出的理论上的信念是否还能坚持住?回归结果不显著,可能是因为理论与现实之间的联系“没有达成”。如果对自己理论假说仍然持坚定信念,那就继续审视其他方面的工作。 第二个需要审视的是实证研究。就不显著问题而言,从实操层面来看,实证分析可以分为两个部分:一个是基准回归,另一个是特殊计量问题处理。前者主要和控制变量有关,后者则和遗漏变量有关。 基准回归的识别策略,是指调换不同控制变量所形成的具体场景(类似于自然科学中的实验),比较不同场景及其估计结果以识别出核心自变量对因变量的影响。关于基准回归,需要强调的是:选取控制变量,以及将不同控制变量逐步引入估计方程,本身就是实证研究策略的重要内容,同时,这一部分必须要有理论上的考虑。我的一个观点是,基准回归部分的重点并不是将最心仪的估计结果寻找到并呈现出来,而是通过调整控制变量及其不同组合,以及比较不同控制情景来“诊断”核心自变量的估计结果。这也就是说,在整个研究过程中,核心自变量的估计结果是“变化”的,其中包括了“不显著”。当某一具体“控制”场景出现不显著时,此时应将关注的重点集中于不显著背后的原因是什么。 在特殊计量问题处理过程中,主要面对的是与遗漏变量问题有关的样本选择偏差问题、内生性问题、异质性问题、测量误差问题。可以回想一下,在很多经典文献中是不是常有这样的“片段”:当有一个特殊计量问题未能考虑或处理时,估计结果不显著,当处理后,估计结果就显著了,符合作者的预期了。这也就是说,当变量估计结果不显著时,可以考虑从遗漏变量角度来思考怎么解决。 需要指出的是,在基础回归与特殊计量问题处理这两个部分中,一些研究者在审视“不显著”的估计结果时,常常将重点集中在特殊计量问题的处理上。对此,我有一个不太恰当的比喻,我将基础回归比喻为白天破案,意指变量是可观察的,而将特殊计量问题处理比喻为黑夜破案,意指变量是不可观察的。相对而言,黑夜破案的难度更大,毕竟信息有限。说这个比喻,目的就是希望研究者能够重视基础回归。 第三个需要审视的是数据和指标。从研究经验方面来讲,提供两个小的建议,一个是针对数据平滑方面,例如可以考虑取对数、降维等。一个是针对奇异值处理方面,适当、谨慎地去除奇异值,是可以一试的。 小结一下,我对不显著的认识是: 第一,要检查自己对理论假说的信念。 第二,对于不显著,首先需要考虑的是不显著是在一种什么样的具体控制场景下出现的,然后才是分析什么原因导致了这个不显著。即,要将不显著与具体控制场景联系起来。 第三,对于不显著,还需要考虑的是遗漏变量问题。 第四,还可以从数据平滑、去除奇异值等方面去“检查”。 |
|