观察性研究控制混杂因素第一弹：分层分析

钟山紫竹林 2020-01-17

展开全文

在随机对照试验（RCT）中，随机化保证了研究对象的各项基线特征（例如年龄、性别、疾病严重程度、伴随疾病等能够影响疾病预后的因素）在试验组和对照组之间的均衡性。

然而，RCT研究并非总是可行。

第一，对于需要很长时间的干预和随访来观察长期效应的研究，或者需要大量样本来观察罕见严重不良事件的研究，RCT并不是最理想的，因为它十分昂贵且需要耗费大量资源，实施起来也非常困难；

第二，当研究的干预措施具有一定风险时，随机分组则可能无法满足伦理要求，不能将患者随机分配到具有一定风险的干预组中。

针对这些情况，观察性研究可以提供更好的证据来源。实际上，越来越多设计规范的观察性研究被广泛应用到疗效比较中，甚至有学者认为观察性研究能够解决RCT在人群普遍适用性上的缺陷，从而提供最接近真实世界的疗效评价结果。

然而，在真实世界中，治疗方案的选择往往是根据可能影响患者预后的因素来确定的，而这些影响因素在暴露/处理组和非暴露/对照组的人群中常常分布并不均衡，这就导致观察性研究的结果可能会产生一定的偏倚。

为了克服预后因素分布的不均衡性，保证观察性研究结果的真实性和可靠性，我们可以从统计学的角度来对其进行调整和处理，常用的统计学方法包括分层分析(Stratified Analysis)、多因素调整分析(Multivariable risk adjustment)、倾向性评分分析(Propensity Score Analysis，PSA)、工具变量分析(Instrumnental Variable Analysis，IVA)等等。

我们将通过一系列的文章，针对观察性研究控制混杂因素的方法一一向大家介绍。

混杂因素

在介绍各种方法之前，我们首先要搞清楚什么是混杂因素，为什么调整混杂因素很重要。当我们想要评估某种干预措施的疗效时，最为理想的研究方案是，除了干预措施以外，其他所有可能会影响结局的因素，包括已知的和未知的因素，在两组研究对象之间均保持一致。

随机化是解决这一问题最理想的方法，但在观察性研究中暴露/处理因素往往是病人自行或被动选择的，从而导致暴露/处理组和非暴露/对照组人群之间的预后因素分布不均衡，使得真实的效应值被低估或高估，引起偏倚。这种现象我们称之为混杂（Confounding），其中引起混杂效应的因素被称为混杂因素（Confounder）。

混杂因素通常具备以下几个特点：

1、混杂因素必须与研究结局密切相关；

2、混杂因素又与研究的暴露/处理因素有关；

3、混杂因素一定不是暴露/处理因素和研究结局之间因果关系链上的中间变量，它们三者的关系如图1所示。

有一些混杂因素是已知的，并且可以被准确测量，但是还有很多潜在的混杂因素是我们未知且无法测量的，这些混杂因素也会对结果造成一定的偏倚，我们称之为残余混杂（Residual Confounding）。

为了控制混杂因素对研究结果的干扰，减少偏倚，我们需要对混杂因素进行一定的调整，使其在暴露/处理组和非暴露/对照组中分布均衡，才能更准确地探讨暴露/处理因素与研究结局之间的关联性，保证观察性研究结果的真实可靠。

分层分析

分层分析是一种常用的控制混杂因素的方法，它是将数据资料按照某个需要控制的混杂因素进行分层，然后再估计暴露/处理因素与研究结局之间的关联性。

分层分析的一般步骤为：

1. 计算总人群中暴露/处理因素与研究结局的效应值，即粗RR（相对危险度）或OR（比值比）值；

2. 将研究资料按照混杂因素来进行分层，计算各层内暴露/处理因素与研究结局的效应值，即分层RR或OR值；

3. 判断各层之间的效应值是否一致，即判断层间RR或OR值是否相近或同质。若各层之间的RR或OR值不一致，则不能合并，需要分层报告效应值。

4. 若各层之间的RR或OR值基本一致，则可以用M-H（Mantel-Haenszel）法计算合并的效应值，即调整（控制混杂因素后）的RR或OR值；再将合并的RR或OR值与分层前的粗RR或OR值进行比较。

若调整后的RR或OR值与粗RR或OR值不一致，可以认为分层因素存在混杂作用【《流行病学（第六版）》建议，差值在0.1以上（RR或OR<1时），或在0.5以上（RR或OR>1时）时，认为调整后RR或OR值与粗RR或OR值不一致】。此时，还要结合临床或生物学意义进行综合分析，而不应该仅仅根据统计学结果来判断。

研究实例

举一个例子，如图2所示，假设我们进行一个队列研究（队列研究是观察性研究的一种）来探讨某种处理的疗效，处理组和对照组各100人，其中处理组中有80人为年轻人，20人为老年人，而对照组中有20人为年轻人，80人为老年人。

经过一段时间的随访，处理组中死亡12人，其中8人为年轻人，4人为老年人，对照组中死亡18人，其中2人为年轻人，16人为老年人。直接计算处理因素的RR为12%/18%，即0.67，可认为该处理是有效的，能够降低33%的死亡风险。

由于年龄本身与死亡密切相关，且年龄在两组之间分布严重不均衡，年龄作为一个混杂因素，可能会对结果造成一定的偏倚。下面我们按照年龄进行分层，来重新评估不同年龄分层下的处理因素的效应值。

首先在年轻人中，处理组80人死亡8人（10%），对照组20人死亡2人（10%），处理因素的RR为10%/10%=1，在老年人中，处理组20人死亡4人（20%），对照组80人死亡16人（20%），处理因素的RR为20%/20%=1，将分层后的RR值进行合并计算，得到控制年龄混杂因素后的调整RR值为1，则可认为两组人群的死亡风险相同。

从这个例子我们发现，在未进行分层分析之前，由于处理组年轻人较多，而年轻人的死亡风险又较低，因此初步的结果倾向于认为处理因素可以降低死亡风险。但是按照年龄因素进行分层后，由于年龄在两组之间的分布严重不均衡，掩盖了处理因素的真实效应，在对年龄进行分层分析后，才发现处理因素实际上对于死亡风险并无影响。

分层分析局限性

在上述例子中，我们仅考虑了年龄一个混杂因素，并对其进行了分层分析，假设此时增加一个混杂因素——糖尿病，且糖尿病在处理组和对照组人群中分布也不均衡，我们就需要同时对年龄和糖尿病进行分层，即分为年轻糖尿病组、年轻非糖尿病组、老年糖尿病组和老年非糖尿病组，共4层，并在每一层下进行单独分析，最后将结果进行汇总。

如果再增加一个混杂因素——高血压，此时有3个混杂因素，就要分为8层（2³）。若有n个混杂因素，则分层的数量即为2ⁿ。

在实际研究中，混杂因素的数量往往较多且非常复杂，因而研究对象就会被分割为很多亚层，计算就会变得非常复杂，同时每一层的样本量就会变得很少，结果也会很不稳定。并且对于连续性的变量，在进行分层分析时需要将其转化为分类变量，这样也造成了信息损失，降低了数据的利用效率。

因此，当我们的研究中存在较多的混杂因素，且混杂因素较为复杂时，应该如何对混杂因素进行控制和调整呢？我们将在下期内容中介绍更多实用的统计方法。

参考文献：

1. JAMA. 2017 Feb 21;317(7):748-759