前天后台收到一个咨询,问一篇发表文章的里面,这个统计模型是怎么分析出来的。详情见下图。这到底是咋回事呢?怎么搞那么多模型,这么多模型到底说明啥呢? 精鼎49期北京班如期正式开班,30人满员,最终还有部分学员未能报上名,只能下半年再参加北京班啦!学习热情如火如荼,欲参加上海班的报名从速哦! (2019-6月28-30日) 松哥统计说 案情分析: 关于模型 偷偷告诉你,有三种哦 松哥常说“高级统计找关系”,找关系就是建模型。模型就是用数量关系表示变量之间的因果关系。可是,很多人把建模型当做一回事。其实不对哦!注意啦!国内教科书就没提过这事。根据研究目的,生物医药领域建模有三大类: 目的一:筛选危险因素 按照教科书的建模策略外,记住松哥一句话(常规套路):先单后多,全有意义。 先进行单因素筛选,将有意义的再进行多因素分析。最终留在模型中的因素要全部有意义。 目的二:验证危险因素 按照教科书的建模策略外,记住松哥一句话(常规套路):当面对质,验明真身。意思是单因素分析得到的结果,很可能是虚假的结果,该结果的表现很可能受到其他因素的影响。因此,您要明确知道某元素A是不是某疾病B的风险因素及程度大小。应该纳入其他可能的混杂因素,多因素当面对质,才能验明真身。 目的三:预测风险 按照教科书的建模策略外,记住松哥一句话(常规套路):预测要准,模型要评。 前面的2个模型,其实重点在X(自变量),而这个第三种模型,研究的重点在Y,是想如何通过一系列的X,去尽量准确的预测Y,预测越准越好。 预测模型一定要评价。评价从三方面着手:校准度、区分度和临床适用性。通常成为ABCD法则。 关于本例 案情解析,抽丝剥茧 本例一看这种统计表达,就是符合松哥说的目的二,是为了验证某个因素X对Y的作用。 1:作者先建立一个模型1: 该模型只用X和Y构建了Logistic回归模型,模型有意义,P<0.05,OR=1.039,95%CI:[1.007-1.072]。说明该X对Y的发生还是有一定的风险的,尽管风险较小。【画外音:咨询者太抠门,截图连标题都没有,让我们对X和Y只能想象!】。 2:作者又构建了模型2: 模型2中,自变量分别为X、性别和年龄,【注意,这就叫做当面对质哦】。意思是,虽然X单因素分析虽然有意义,但很可能是别的因素【性别和年龄】对其的干扰,因此,模型中加入性别和年龄,当面问清楚,是不是他们两个作用的结果。 结果可见,消除了性别和年龄影响后,X依旧P<0.05有统计学意义。 3:模型3: 继续当面对质性别和年龄,BMI和WHR。发现X依旧有统计学意义。说明上述4个因素都没有影响X对Y的作用。 4:模型4: 继续当面对质性别,年龄,BMI,WHR,SBP和DBP。发现X依旧对Y有意义。 5:模型5: 继续当面对质,性别,年龄,BMI,WHR,SBP,DBP,TG,TC,HDL-C,LDL。此时美妙的一幕发生了。X对Y的影响已经P>0.05,95%CI已经跨越1,已经没有意义。 6:折腾半天,最终说明了啥! 从前,有个人,名叫X,在不适合的时间出现在不适合的地点,别怀疑杀了Y。 找了2个证人性别和年龄,他俩说:我们不能证明X是无辜的。 又找了2个证人BMI,WHR,他俩说:我们不能证明X是无辜的。 又找了2个证人SBP,DBP,他俩说:我们不能证明X是无辜的。 又找了4个证人TG,TC,HDL-C,LDL,他们说:我们能证明X是无辜的。 最终结案,X不是Y的杀人凶手! 花絮篇 总有一些情理之外的东西 看了松哥的闲扯,有人必有如下问题,如果你没有,你要么高手,要么没看懂,呵呵! 1:到哪里去找那么多证人? 2:要找多少证人? 3:一定要找到最终证明无辜的证人吗? 4:为啥证人只是增加,没意义的如性别和年龄,在后续建模中,为什么不剔除? 5:您还有别的疑问吗? 一年之计在于跟着松哥学统计!
|
|