分享

如何用回归控制某个变量或者说消除某个变量影响【松哥荐读】

 松哥精鼎统计 2020-10-23
导读

      前天后台收到一个咨询,问一篇发表文章的里面,这个统计模型是怎么分析出来的。详情见下图。这到底是咋回事呢?怎么搞那么多模型,这么多模型到底说明啥呢?

精鼎49期北京班如期正式开班,30人满员,最终还有部分学员未能报上名,只能下半年再参加北京班啦!学习热情如火如荼,欲参加上海班的报名从速哦!

精鼎50期SPSS统计软件实战班-上海

(2019-6月28-30日)

松哥统计说

案情分析:

关于模型

偷偷告诉你,有三种哦

松哥常说“高级统计找关系”,找关系就是建模型。模型就是用数量关系表示变量之间的因果关系。可是,很多人把建模型当做一回事。其实不对哦!注意啦!国内教科书就没提过这事。根据研究目的,生物医药领域建模有三大类:

目的一:筛选危险因素

按照教科书的建模策略外,记住松哥一句话(常规套路):先单后多,全有意义

先进行单因素筛选,将有意义的再进行多因素分析。最终留在模型中的因素要全部有意义。

目的二:验证危险因素

按照教科书的建模策略外,记住松哥一句话(常规套路):当面对质,验明真身。意思是单因素分析得到的结果,很可能是虚假的结果,该结果的表现很可能受到其他因素的影响。因此,您要明确知道某元素A是不是某疾病B的风险因素及程度大小。应该纳入其他可能的混杂因素,多因素当面对质,才能验明真身。

目的三:预测风险

按照教科书的建模策略外,记住松哥一句话(常规套路):预测要准,模型要评。

前面的2个模型,其实重点在X(自变量),而这个第三种模型,研究的重点在Y,是想如何通过一系列的X,去尽量准确的预测Y,预测越准越好。

预测模型一定要评价。评价从三方面着手:校准度、区分度和临床适用性。通常成为ABCD法则。

关于本例

案情解析,抽丝剥茧

本例一看这种统计表达,就是符合松哥说的目的二,是为了验证某个因素X对Y的作用。

1:作者先建立一个模型1:

该模型只用X和Y构建了Logistic回归模型,模型有意义,P<0.05,OR=1.039,95%CI:[1.007-1.072]。说明该X对Y的发生还是有一定的风险的,尽管风险较小。【画外音:咨询者太抠门,截图连标题都没有,让我们对X和Y只能想象!】。

2:作者又构建了模型2:

模型2中,自变量分别为X、性别和年龄,【注意,这就叫做当面对质哦】。意思是,虽然X单因素分析虽然有意义,但很可能是别的因素【性别和年龄】对其的干扰,因此,模型中加入性别和年龄,当面问清楚,是不是他们两个作用的结果。

结果可见,消除了性别和年龄影响后,X依旧P<0.05有统计学意义。

3:模型3:

继续当面对质性别和年龄,BMI和WHR。发现X依旧有统计学意义。说明上述4个因素都没有影响X对Y的作用。

4:模型4:

继续当面对质性别,年龄,BMI,WHR,SBP和DBP。发现X依旧对Y有意义。

5:模型5:

继续当面对质,性别,年龄,BMI,WHR,SBP,DBP,TG,TC,HDL-C,LDL。此时美妙的一幕发生了。X对Y的影响已经P>0.05,95%CI已经跨越1,已经没有意义。

6:折腾半天,最终说明了啥!

从前,有个人,名叫X,在不适合的时间出现在不适合的地点,别怀疑杀了Y。

找了2个证人性别和年龄,他俩说:我们不能证明X是无辜的。

又找了2个证人BMI,WHR,他俩说:我们不能证明X是无辜的。

又找了2个证人SBP,DBP,他俩说:我们不能证明X是无辜的。

又找了4个证人TG,TC,HDL-C,LDL,他们说:我们能证明X是无辜的。

最终结案,X不是Y的杀人凶手!

花絮篇

总有一些情理之外的东西

看了松哥的闲扯,有人必有如下问题,如果你没有,你要么高手,要么没看懂,呵呵!

1:到哪里去找那么多证人?

2:要找多少证人?

3:一定要找到最终证明无辜的证人吗?

4:为啥证人只是增加,没意义的如性别和年龄,在后续建模中,为什么不剔除?

5:您还有别的疑问吗?

一年之计在于跟着松哥学统计!

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多