在随机对照试验(RCT)中,随机化保证了研究对象的各项基线特征(例如年龄、性别、疾病严重程度、伴随疾病等能够影响疾病预后的因素)在试验组和对照组之间的均衡性。 然而,RCT研究并非总是可行。 第一,对于需要很长时间的干预和随访来观察长期效应的研究,或者需要大量样本来观察罕见严重不良事件的研究,RCT并不是最理想的,因为它十分昂贵且需要耗费大量资源,实施起来也非常困难; 第二,当研究的干预措施具有一定风险时,随机分组则可能无法满足伦理要求,不能将患者随机分配到具有一定风险的干预组中。 针对这些情况,观察性研究可以提供更好的证据来源。实际上,越来越多设计规范的观察性研究被广泛应用到疗效比较中,甚至有学者认为观察性研究能够解决RCT在人群普遍适用性上的缺陷,从而提供最接近真实世界的疗效评价结果。 然而,在真实世界中,治疗方案的选择往往是根据可能影响患者预后的因素来确定的,而这些影响因素在暴露/处理组和非暴露/对照组的人群中常常分布并不均衡,这就导致观察性研究的结果可能会产生一定的偏倚。 为了克服预后因素分布的不均衡性,保证观察性研究结果的真实性和可靠性,我们可以从统计学的角度来对其进行调整和处理,常用的统计学方法包括分层分析(Stratified Analysis)、多因素调整分析(Multivariable risk adjustment)、倾向性评分分析(Propensity Score Analysis,PSA)、工具变量分析(Instrumnental Variable Analysis,IVA)等等。 我们将通过一系列的文章,针对观察性研究控制混杂因素的方法一一向大家介绍。
在介绍各种方法之前,我们首先要搞清楚什么是混杂因素,为什么调整混杂因素很重要。当我们想要评估某种干预措施的疗效时,最为理想的研究方案是,除了干预措施以外,其他所有可能会影响结局的因素,包括已知的和未知的因素,在两组研究对象之间均保持一致。 随机化是解决这一问题最理想的方法,但在观察性研究中暴露/处理因素往往是病人自行或被动选择的,从而导致暴露/处理组和非暴露/对照组人群之间的预后因素分布不均衡,使得真实的效应值被低估或高估,引起偏倚。这种现象我们称之为混杂(Confounding),其中引起混杂效应的因素被称为混杂因素(Confounder)。 混杂因素通常具备以下几个特点: 1、混杂因素必须与研究结局密切相关; 2、混杂因素又与研究的暴露/处理因素有关; 3、混杂因素一定不是暴露/处理因素和研究结局之间因果关系链上的中间变量,它们三者的关系如图1所示。 有一些混杂因素是已知的,并且可以被准确测量,但是还有很多潜在的混杂因素是我们未知且无法测量的,这些混杂因素也会对结果造成一定的偏倚,我们称之为残余混杂(Residual Confounding)。 为了控制混杂因素对研究结果的干扰,减少偏倚,我们需要对混杂因素进行一定的调整,使其在暴露/处理组和非暴露/对照组中分布均衡,才能更准确地探讨暴露/处理因素与研究结局之间的关联性,保证观察性研究结果的真实可靠。
分层分析的一般步骤为: 1. 计算总人群中暴露/处理因素与研究结局的效应值,即粗RR(相对危险度)或OR(比值比)值; 2. 将研究资料按照混杂因素来进行分层,计算各层内暴露/处理因素与研究结局的效应值,即分层RR或OR值; 3. 判断各层之间的效应值是否一致,即判断层间RR或OR值是否相近或同质。若各层之间的RR或OR值不一致,则不能合并,需要分层报告效应值。 4. 若各层之间的RR或OR值基本一致,则可以用M-H(Mantel-Haenszel)法计算合并的效应值,即调整(控制混杂因素后)的RR或OR值;再将合并的RR或OR值与分层前的粗RR或OR值进行比较。 若调整后的RR或OR值与粗RR或OR值不一致,可以认为分层因素存在混杂作用【《流行病学(第六版)》建议,差值在0.1以上(RR或OR<1时),或在0.5以上(RR或OR>1时)时,认为调整后RR或OR值与粗RR或OR值不一致】。此时,还要结合临床或生物学意义进行综合分析,而不应该仅仅根据统计学结果来判断。
经过一段时间的随访,处理组中死亡12人,其中8人为年轻人,4人为老年人,对照组中死亡18人,其中2人为年轻人,16人为老年人。直接计算处理因素的RR为12%/18%,即0.67,可认为该处理是有效的,能够降低33%的死亡风险。 由于年龄本身与死亡密切相关,且年龄在两组之间分布严重不均衡,年龄作为一个混杂因素,可能会对结果造成一定的偏倚。下面我们按照年龄进行分层,来重新评估不同年龄分层下的处理因素的效应值。 首先在年轻人中,处理组80人死亡8人(10%),对照组20人死亡2人(10%),处理因素的RR为10%/10%=1,在老年人中,处理组20人死亡4人(20%),对照组80人死亡16人(20%),处理因素的RR为20%/20%=1,将分层后的RR值进行合并计算,得到控制年龄混杂因素后的调整RR值为1,则可认为两组人群的死亡风险相同。 从这个例子我们发现,在未进行分层分析之前,由于处理组年轻人较多,而年轻人的死亡风险又较低,因此初步的结果倾向于认为处理因素可以降低死亡风险。但是按照年龄因素进行分层后,由于年龄在两组之间的分布严重不均衡,掩盖了处理因素的真实效应,在对年龄进行分层分析后,才发现处理因素实际上对于死亡风险并无影响。
如果再增加一个混杂因素——高血压,此时有3个混杂因素,就要分为8层(23)。若有n个混杂因素,则分层的数量即为2n。 在实际研究中,混杂因素的数量往往较多且非常复杂,因而研究对象就会被分割为很多亚层,计算就会变得非常复杂,同时每一层的样本量就会变得很少,结果也会很不稳定。并且对于连续性的变量,在进行分层分析时需要将其转化为分类变量,这样也造成了信息损失,降低了数据的利用效率。 因此,当我们的研究中存在较多的混杂因素,且混杂因素较为复杂时,应该如何对混杂因素进行控制和调整呢?我们将在下期内容中介绍更多实用的统计方法。 参考文献: 1. JAMA. 2017 Feb 21;317(7):748-759 |
|