刘西川：不显著，怎么办？

湖经松哥 2024-05-26 发布于湖北

展开全文

来源：刘西川阅读写作课

在计量回归分析过程中，核心自变量的估计系数不显著，怎么办？在一些推文（如：微信公众号“经管定量笔记”推送的“在因果关系研究中，回归系数不显著怎么办？有以下解决思路”）中，推荐了一些解决思路，例如选方程、选变量、选样本、选方法、缺失值处理等。

一般来说，做回归分析，遇到核心自变量不显著是常事。在指导学生论文写作的过程中，我发现确实有学生困惑于如何处理不显著问题。在这里，我想谈一下自己对不显著这个问题的看法和思考。

面对回归结果不显著，我的第一反应不是想办法把不显著调成显著。当核心变量回归结果不显著、不符合理论预期时，我们应该做的是全面审视自己的研究工作。

第一个需要审视的是自己对理论假说的信念。在估计结果不显著的现实出现后，之前所提出的理论上的信念是否还能坚持住？回归结果不显著，可能是因为理论与现实之间的联系“没有达成”。如果对自己理论假说仍然持坚定信念，那就继续审视其他方面的工作。

第二个需要审视的是实证研究。就不显著问题而言，从实操层面来看，实证分析可以分为两个部分：一个是基准回归，另一个是特殊计量问题处理。前者主要和控制变量有关，后者则和遗漏变量有关。

基准回归的识别策略，是指调换不同控制变量所形成的具体场景（类似于自然科学中的实验），比较不同场景及其估计结果以识别出核心自变量对因变量的影响。关于基准回归，需要强调的是：选取控制变量，以及将不同控制变量逐步引入估计方程，本身就是实证研究策略的重要内容，同时，这一部分必须要有理论上的考虑。我的一个观点是，基准回归部分的重点并不是将最心仪的估计结果寻找到并呈现出来，而是通过调整控制变量及其不同组合，以及比较不同控制情景来“诊断”核心自变量的估计结果。这也就是说，在整个研究过程中，核心自变量的估计结果是“变化”的，其中包括了“不显著”。当某一具体“控制”场景出现不显著时，此时应将关注的重点集中于不显著背后的原因是什么。

在特殊计量问题处理过程中，主要面对的是与遗漏变量问题有关的样本选择偏差问题、内生性问题、异质性问题、测量误差问题。可以回想一下，在很多经典文献中是不是常有这样的“片段”：当有一个特殊计量问题未能考虑或处理时，估计结果不显著，当处理后，估计结果就显著了，符合作者的预期了。这也就是说，当变量估计结果不显著时，可以考虑从遗漏变量角度来思考怎么解决。

需要指出的是，在基础回归与特殊计量问题处理这两个部分中，一些研究者在审视“不显著”的估计结果时，常常将重点集中在特殊计量问题的处理上。对此，我有一个不太恰当的比喻，我将基础回归比喻为白天破案，意指变量是可观察的，而将特殊计量问题处理比喻为黑夜破案，意指变量是不可观察的。相对而言，黑夜破案的难度更大，毕竟信息有限。说这个比喻，目的就是希望研究者能够重视基础回归。

第三个需要审视的是数据和指标。从研究经验方面来讲，提供两个小的建议，一个是针对数据平滑方面，例如可以考虑取对数、降维等。一个是针对奇异值处理方面，适当、谨慎地去除奇异值，是可以一试的。

小结一下，我对不显著的认识是：

第一，要检查自己对理论假说的信念。

第二，对于不显著，首先需要考虑的是不显著是在一种什么样的具体控制场景下出现的，然后才是分析什么原因导致了这个不显著。即，要将不显著与具体控制场景联系起来。

第三，对于不显著，还需要考虑的是遗漏变量问题。

第四，还可以从数据平滑、去除奇异值等方面去“检查”。