叫兽君先前提及,在真实世界的临床研究,最常用的方法是采用回归的方法开展统计处理,回归方法看起来简单,但实际上操作上还是有一定技巧,所以很多人似懂非懂,因此接下来,叫兽君利用一定的篇幅来讨论回归模型的构建技巧。 首先,我们来讨论回归中的混杂因素。 临床研究中,回归扮演的角色有两个,第一,同时研究多种因素的影响,第二,剔除混杂因素的作用。一般来说,现代医学研究,第一点已经不太多了,因为哪有这么多影响因素可以研究?一篇论文最好是有很好的焦点。至于混杂因素,大多人估计已经接受了一些理论知识的洗礼,总结来说混杂因素就是 (1)该因素对结局有影响,可利用单因素回归或χ2检验来验证。 (2)该因素在分析因素中的分布不均衡,可用χ2检验验证一下。 (3)从专业角度来判断,即该因素不能是分析因素与结局关系的一个中间中介。也就是说,不能是分析因素引起该因素,通过该因素再引起结局。这一点主要根据专业知识来确定。 如果同时满足这三个条件,基本可以断定是混杂因素。如果有一条不满足,该因素就不是混杂因素。 如下者,研究某药物X的治疗肿瘤的效果(Z),同时发现,药物X可能通过改变体内的物质Y而影响疗效。由于非随机,药物Z的使用还受到患者人口学、社会、经济因素(C)的影响。 C是混杂因素,Y是中介变量 举例 估计各位还是一头雾水,如何才能利用统计软件来甄别混杂因素呢,我们通过例子来说明。 案例:分析性别、吸烟对幽门螺杆菌(HP)的影响,判断吸烟是否是性别-HP因果关联上的混杂因素。 首先我们来看看吸烟与性别的关系,卡方检验提示,男女吸烟存在差异。混杂因素第一条件符合。 其次,我们判断吸烟是否对Hp有影响:单因素logistic回归,结果吸烟对Hp的发生有一定影响,吸烟发生的危险更高一些,说明第二个条件也符合。 根据专业知识判断,吸烟一般不是性别-HP因果关系链上的一个中介变量,因此,可以认为在本例中,吸烟是混杂因素。 我们继续采用多因素logistic回归来看看,吸烟在不在场,性别与HP的关系。 当吸烟不在模型时,
当吸烟在模型时, 然两者均有统计学意义,但是在性别的估计上存在一定的差异但后者更为准确。各位,看出端倪了吗?以上是一个简单的例子,采用的是logistic回归方法,接下来,叫兽君将深入来传授如何利用回归分析来剔除混杂因素的方法.
|
|