郑老师团队2022年meta分析培训来了,5.25-5.26两天学会meta 两天学会Meta分析!欢迎参加Meta分析线上训练营(6.25-26) 很多人一碰到人群的数据,就是做个回归,探讨影响因素,把所有变量放到回归分析,多因素回归分析,出来个结果就完事了。 实际上,除了随机对照研究之外,临床预后研究根据不同的目的,有3种统计分析角度,它们在回归分析的策略上有所区别,今天我来说两句。主要是两点区别,分别是筛选自变量的区别、模型评价的区别。 预测模型的研究,目的是预测患者预后疾病发展,所以是注重于模型整体效果的方法。它不关注我们挑选的自变量与预后结局指标有没有因果关系,往往要从经济性、可及性、预测效果去挑选自变量。评价自变量的方法不是每个自变量是否具有统计学意义,而是评价该指标的存在是否能够提高模型的性能;而模型的性能往往用R平方、-2倍对数似然值、AIC、BIC、AUC面积等指标来评价。所以,预测模型回归分析,往往是数据驱动的结果。分析时,往往可以先单后多挑选自变量、lasso法筛选自变量、逐步回归法筛选自变量。临床预测模型构建策略是用较少的自变量达到不差的预测效果。因此有上述做法,最后留在模型的指标都应该有它的预测价值。 影响因素研究类文章最多,但是统计学方法被广泛误用,很多人把它等同于预测模型研究,也用R平方、-2倍对数似然值、AIC、BIC、AUC面积评价,用逐步回归法来筛选自变量。其实不该这样。影响因素研究,不讲究模型建的R平方到底有多大,没有统计学意义的自变量也照样可以留在模型中。但是影响因素研究,需要控制自变量数量,因为回归模型不允许自变量太多,否则容易建模失败,所以可采用先单因素再多因素的回归建模策略。 自变量筛选上与预测模型很大的区别的是,影响因素分析科学的做法,不是数据驱动型,而是理论驱动型,要主动挑选理论上与预后指标有因果关系的指标放入模型。这样做两点好处,第1,自变量不会太多,第2,没有因果关系的不纳入模型,结果更好解释。没有认真思考,一股脑纳入所有自变量进行回归分析,得到是将会是垃圾结果。这类研究是临床真实世界研究的主要思路,预后研究不再“雨露均沾”去探讨多个影响因素,而是聚焦于关键1-2个变量(比如治疗措施、关键身体指标)对预后的影响。这类文章容易发好文章。 这类研究与第2种分析范式类似的地方是,它也不注重模型整体AUC面积是否大,R平方是否大,它也需要控制自变量数量。但不同于2种方法,本类研究在建模时除了纳入研究的关键因素之外,其他自变量挑选更加严格,自变量往往是分组不均衡的指标,自变量的个数也更少,往往局限于人口学、社会经济学、行为、缓解等因素,特别要求不能纳入中介变量进入模型,免得会干扰目标研究指标的作用。此外,多因素回归时,也不用采用逐步回归法,允许没有统计学意义的协变量留在模型;如果自变量较多,可采纳“效应改变法”策略进行自变量的去留考虑。 估计很多人会问,什么是效应改变法,下面链接可以看看。更多关于预后研究,可以关注本人7月份的真实世界临床研究的课程,详细见下方链接。2022年,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班,包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、结构方程模型等9门课。如果您有需求,不妨点击查看: 本公众号作为医学数据分析公众号,提供一些免费医学统计学学习资源下载,欢迎点击下载。
|