分享

统计上不显著的变量表明该变量对结果变量没有影响吗?

 计量经济圈 2022-08-13 发布于浙江

箱:econometrics666@126.com

所有计量经济圈方法论丛的code文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于显著或不显著结果,参看:1.常用的12种调变量显著性或调星星的方法,2.不显著能任性发顶刊!还津津有味地讨论不显著的实证结果!3.前沿, 终于有人解释为什么顶刊上很少有不显著的结果发表! 背后机理?4.回归中常数项显著说明模型中有遗漏变量问题?5.为什么回归系数不显著? 6.关于模型中变量选择的五个误区, 譬如不显著的变量需要剔除还是保留?7.控制变量就能影响结果显著性, 所以存在很大操作空间, 调参数是常用手段吗?8.添加一个新变量能使以前不显著的变量变得显著了?9.核心解释变量A不显著, 但加入变量B后, 为什么A和B都显著了?10.若系数回归结果不显著, 我们能够采取的方法和思路有哪些?11.结果不显著但成功发在Top期刊上的论文有哪些?你心虚过没?12.交互效应显著的几种情况, 列出了6种类型,13.交互项中主效应不显著, 交互项显著可怕吗? 14.统计显著与经济显著, 发AER和经济研究的标配,15.显著不显著的后背是什么, 非(半)参估计里解决内生性,16.试了几百次, 回归结果依然不显著, 到底咋办,17.科学家倡议P值需要0.005,显著性判断才成立,18.SSCI期刊竟公开征集“不显著的实证结果”的专刊文章!19.IV与Y在理论上无直接关系, 但用Y对IV做回归发现IV是显著的, 这是咋回事?20.实证研究中的P值: 误解, 操纵及改进, 探析P值操纵表现及原因,提出相应的改进策略,21.AER强调计量方法的重要性, 经济学因果分析中的p值操纵和发表偏倚!

正文

计量社群里讨论了一个关于”解释统计上不显著显著的回归系数“的问题。
Q:在回归模型中统计上不显著的变量,则表明该变量对结果变量没有影响吗?

A一般而言,“一个变量不显著,则表明该变量对结果变量没有影响”的说法是不对的。即使一个效应确实存在,但可能因为样本量太小,或者随机变异太大,该变量在统计上不显著,又或者因为该变量与其他变量相关,而数据无法知道相关变量的影响有多少属于哪个个体变量。
不显著只意味着数据没有提供存在影响的证据,但这并不意味着这种效应不存在。
一个不显著的变量的系数,原则上仍然可以解释。不过,因为随机变化以及没有结论性的证据表明该变量有任何影响,因此,在大多数情况下,对这种系数的解释可能并不重要,因为它带有太多的不确定性。
更有意义的是解释系数的置信区间,因为这也表达了不确定性。
样本量计算也有助于解释不显著的系数。若样本量小且功效较低,你不可能期望看到显著的结果(即使系数确实非零)。
但是,如果样本量大且功效足够,那么不显著的结果更容易解释:你未能拒绝零假设是因为数据不支持它,而不是因为没有收集到足够的数据而拒绝零假设

B:你不能这么说。你只能说无法以合理的信心确认它具有正向的影响。查看回归系数的置信区间会提供更多信息——你可以相信它的影响可以忽略不计。

C:"不显著" --> "数据不能够充分地得出结论",这意味着统计信噪比太大。
这可能是因为:
①信号(效应;例如,预测变量减少残差)太小,
②噪声(响应数据的方差)太大,
③样本量太小(因为“统计噪声”随着样本量而减小,任何数量的噪声都可以通过使用足够大的样本量来消除“平均”),
④或者它们的任何组合。

D我来说一下解决办法吧!
假设统计模型是恰当的,遇到不显著的回归系数,此时,你可以:
①用更大的样本量重复该研究
②重新考虑实验设计(采用更少噪声的测量方法,扩大因变量的范围)
③重新考虑研究问题(你的时间和金钱投入到回答不同的问题上可能会更好)


关于社群讨论,参看:1.“显著不显著的后背是什么, 非(半)参估计里解决内生性”,2.“计量社群里关于使用交互项还是中介效应分析开展机制研究的讨论”,3.“为啥面板数据回归中, 即使X对Y的解释程度很大, 但R-square一般都很小?”,4.多期DID中使用双向固定效应可能有问题! 又如何做平行趋势检验? 多期DID方法的最新进展如何?,5.收入和年龄等变量是将其转化成有序离散变量还是当成连续变量进行回归呢?6.控制变量就能影响结果显著性, 所以存在很大操作空间, 调参数是常用手段吗?7.回归中常数项显著说明模型中有遗漏变量问题?8.审稿人有义务告诉你回归中可能的遗漏变量么?9.针对很多实证问题的讨论, 随手保存的部分内容以飨学者,10.未引入交互项主效应为正, 引入后变为负, 解释出来的故事特别好, 主效应符号确实增强了故事性,11.双向固定效应多期DID最新进展和代码汇总, 关于控制变量和固定效应选取的讨论,12.逐年匹配的PSM-DID操作策略, 多时点panel政策评估利器,13.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等,14.针对经济学领域中介效应模型问题的回应和理性讨论,15.讨论a(b)对b(a)的新方向论文, 经济学期刊分区问题, 3个机制存在时计量模型设计问题,16.如果解决了内生性, 那么是否意味着证实了变量之间的因果关系呢?17.解释变量提升一个标准差,被解释变量提升几个百分比呢?18.关于DID中对照组与处理组的比例问题?19.双重差分法和事件研究法的区别主要在哪里?20.双重差分法和事件研究法的区别主要在哪里?21.IV与Y在理论上无直接关系, 但用Y对IV做回归发现IV是显著的, 这是咋回事?


1.免费4门课程, 因果推断1和2, IV, 份额移动IV和高级DID, 附数据,代码,讲义和阅读清单,2.哈佛“数据科学导论”课程对所有人免费开放!包括机器学习和回归分析等各种方法!3.加拿大经济学会主席的"机器学习"课程可以学习了! 共计20份Slides直指ML前沿!4.耶鲁开设“应用实证方法”P.hd课程, 强逻辑, 好文献, 重实操, 真前沿, 送slides和笔记!5.诺奖得主Angrist的因果推断课程文献读物单子再次更新了, 还提供了其他三门课程,6.全面且前沿的因果推断课程, 提供视频, 课件, 书籍和经典文献,7.美国博士用4年整理了写论文的各章实用资料, 包括课程, 软件, 研究, 投稿和工作等,8.MIT经济系50门开放课程对中国学者开放, 包括计量经济学等各类经济学课程!9.MIT斯隆商学院研究生课程对国内免费开放, 在家就能学习世界一流商学院的课程!10.从入门到进阶的Python数据分析手册, 课程内容完全免费!11.疫情期计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用


关于因果推断书籍:哈佛大学新修订完成的因果推断经典大作免费下载!附数据和code!图灵奖得主Pearl的因果推断新科学, Why?计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用(慕课上有不少免费课程,建议年轻学者好好使用),④你应该阅读哪本因果推断书籍: 一份进阶流程图和简短书评列表

下这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

3.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。


    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章