系统综述中的统计分析（1/5）：分析目的和Meta分析原理

yuhaizju 2019-12-19

展开全文

系统综述（systematic review）是一种系统地、定量地总结和整合现有文献、进行科学推论的研究方法，其本质是综述，目的是总结、提炼和整合文献，“系统”特指收集原始文献的全面性、操作方法的可靠性和统一性，以及利用meta分析定量地整合结果。Meta分析（meta-analysis）是系统综述中用来定量地整合多个有关研究的结果以获得能够代表这些研究的平均结果的统计学方法。本系列文章是本公众号之前推出的“系统综述与Meta分析”系列文章的续集，主要介绍系统综述中的统计学分析。有关系统综述的一般理论、概念和方法的详细论述，请参见“系统综述与Meta分析”系列文章。

第一节统计分析的目的和方法

一、统计分析的目的和方法

二、分析单元与效应指标

第二节 Meta分析

一、Meta分析的原理

二、倒方差法

三、Mantel-Haenszel法

四、Peto比值比法

五、固定效应与随机效应模型

六、加权平均方法的比较

七、展示meta分析结果-森林图

第三节异质性及其来源的分析

第四节敏感性分析

第五节发表偏倚的检测和校正

第六节常见meta分析软件介绍

第七节 RevMan分析实例

第一节统计分析的目的和方法

一、统计分析的目的和方法

流行病学数据分析需紧扣研究问题，具有明确的分析目的，采用特定的分析方法，对流行病学数据进行统计整理、分析和总结。数据分析不是简单的统计学游戏，其目的不在于统计学方法的复杂性和新颖性，而在于正确地回答预先提出的研究问题。明确的研究问题及分析目的是进行数据分析的前提。

流行病学研究关注的主要医学问题包括探究疾病病因和危险因素、疾病发生和现患频率、诊断方法的准确性、疾病的转归和预后、干预的效果、干预的副作用等。以研究病因的队列研究为例，数据分析目的主要包括：1）估计效应（或其他指标如诊断方法的灵敏度）的大小及其可信区间；2）控制混杂因素；3）分析可能的剂量效应关系；4）分析可能的交互作用或效应修饰作用；5）分析结果和结论中可能存在的偏倚。

系统综述的数据分析也不例外。首先必须具有明确的研究问题，然后根据研究问题提出明确的分析目的。系统综述的研究问题越重要，分析的结果就越重要，若是无关紧要的问题，再高明的分析也没有太大价值；提出的问题越明确，分析的思路和方法就越清晰，如果问题不明确，再好的分析都是无的放矢，不可能很好地回答先前提出的问题。表1总结了系统综述中常见的分析目的和相应的统计分析方法，本系列文章的主要目的就是介绍这些分析方法的目的、原理和方法。

表1 系统综述中常见的研究目的和相应的统计分析方法

研究目的	统计方法
1.估计总效应及其可信区间	meta分析（包括倒方差法、Peto法、M-H法等），又分为固定效应模型和随机效应模型
2.分析研究间的异质性	Q检验和I²统计量
3.探讨研究间异质性的来源	亚组分析和meta回归
4.检测发表偏倚	漏斗图（funnel plot）及其有关的统计检验，如Egger回归分析和Begg秩相关分析
5.矫正发表偏倚的方法 6.展示meta分析的结果	基于漏斗图的剪补法（trim and fill method）森林图（forest plot）

二、分析单元与效应指标

现以一项有关抗高血压药物疗效的系统综述为例说明问题。研究问题是，与安慰剂对照比较，某抗高血压药物是否可以降低心血管事件发生的风险。合格的研究是比较该药物和安慰剂治疗的随机对照临床试验。数据分析的首要目的是估计总效应的大小及其可信区间。在该系统综述里，效应量就是药物组和安慰剂组心血管事件发生频率的差别，通常用相对危险降低百分数表示。

一项随机对照试验的研究目的由其病人、治疗、对照、结局和治疗环境（即PICOS）决定，评价的治疗和对照组治疗的组合是meta分析的基础。因此，估计总体效应时，要求合并的临床试验的治疗组必须是同一种治疗，对照组也必须是同一种治疗（如安慰剂治疗等）。在系统综述里，我们把这样固定的治疗和对照的组合叫做“比较组合”。

不同的组合回答了不同的临床问题。例如，某药物与安慰剂比较，回答的问题是“该药物是否具有任何治疗效果”，解决的是“治还是不治”的问题；如果对照组是另一种药物，回答的问题则是“该药物的效果是否优于（或劣于或等于）另一种药物”，解决的是“哪一种药物更好”的问题；如果对照组是同一药物的不同剂量，回答的问题则是“该药物不同剂量的效果是否不同”，解决的是“哪一种剂量更好”的问题；如果在现有常规治疗基础上，治疗组外加另外一种药物，对照组加安慰剂治疗，回答的问题则是“在常规治疗基础上，该药是否可以提供额外的疗效”，解决的是“是否需要在常规治疗基础上增加该治疗”的问题。

重要的是，一个meta分析只能包括同一种比较组合的临床试验或者来自不同临床试验的同样的比较组合。在上面假设的系统综述里，比较组合就是药物治疗组和安慰剂治疗组。有时，一个临床试验可能包含多个比较组，如A药、B药和安慰剂。那么，该临床试验则提供了三个不同的比较组合，即A药与安慰剂、B药与安慰剂，以及A药与B药，它们分别回答了截然不同的临床问题，不能混为一谈，不能放入同一个meta分析进行合并。例如，如果关注的是A药与安慰剂的比较组合，那么另外两个比较组合则是无关的。如果三种组合都是研究所关注的，那么该系统综述则至少需要三个基本的meta分析。

确定比较的组合后，则需要确定测量效应使用的结局指标。在该系统综述中，有关的重要的结局指标有多种，如心肌梗死、缺血性脑卒中、出血性脑卒中、所有心血管事件、心血管死亡事件，以及所有原因的死亡事件等。同一个药物对不同结局事件的预防效果可能不同，例如，抗高血压药物预防脑卒中的效果一般大于预防心肌梗死的效果，因此可以针对不同的临床结局分别估计预防的效果。这样，对于一个比较组合，可能需要根据有关结局指标的多少进行多个meta分析。因此，我们进一步定义，由比较组合和结局指标联合决定的meta分析为系统综述的“分析单元”。系统综述必须以分析单元为基本单位，进行数据整理、分析与合并。

在同一个分析单元里，每一个纳入的研究都必须提供有关效应的信息，包括效应估计值及其抽样误差，所有纳入的研究的效应估计及其抽样误差是meta分析的基础。这里，“效应”指标指meta分析可合并的原始研究的结果的统称，如率比、发病率、诊断的灵敏度等。效应指标的选择取决于研究的目的。以评估干预效果的随机对照试验为例，如果结果是二分变量，效应的大小用相对危险降低百分数、绝对危险降低值、需治人数等多种形式表达。有关其他研究的“效应”指标，参见表2。

表2 常见的研究目的与效应指标的选择

第二节 Meta分析

一、Meta分析的原理

Meta分析就是定量合并原始研究结果的方法，它需要原始研究的效应估计值和计算权重所需要的信息。Meta分析合并的结果是原始研究效应的加权平均值，反映了原始研究背后的真实效应。如果把meta分析分解为两个步骤，第一步就是估计原始研究的效应和权重，第二步则是利用第一步的信息计算效应的加权平均值。

加权平均与简单平均的方法和结果十分类似。以血压为例，平均血压是每个研究对象血压值的总和除以研究对象的总人数，因为分母中每个研究对象是同等对待的，每一个人都赋予了同样大小的权重，其结果是一个简单的平均值。因此，一般的平均数不是加权平均值，或者说是加权平均中权重相等的特例。在meta分析里，研究的单位不是一个人，而是一个研究，我们完全可以用简单平均的方法来估计不同研究的平均结果。但是，不同的研究样本大小不同，它们获得的信息的精确度也不同，不应一视同仁。

如果所有原始研究都来自同一总体且不存在偏倚，不同研究估计的效应值也会不同，与小样本研究结果相比，大样本研究结果的平均值更接近真实值，用简单平均的方法同等地对待不同样本量大小的原始研究，显然是不合理的。一个直观的解决方法就是根据研究样本量大小，赋予不同的权重，样本量越大，赋予的权重越大，反之亦然，这样计算的平均值就叫加权平均值。相关的平均方法叫作加权平均法，也就是常说的meta分析。加权平均值直接受样本量大小的影响，更多地反映了大样本研究的结果。确切地讲，使用样本量加权的方法应叫做样本量加权平均法。

更精确地说，如果所有原始研究都来自同一总体且不存在偏倚，原始研究结果与真实值的差异直接与其方差成反比，通过方差间接地与样本量成正比。因此，meta分析的一个通用方法就是根据效应的方差的大小进行加权。该加权平均法可以用于任何结果或效应指标，是meta分析中使用最多的方法，我们称其为通用加权平均法。确切地讲，该方法应叫做倒方差加权平均法。另外，流行病学资料分析里常用的Mantel-Haenszel法和Peto比值比法也是有效的加权平均法，是合并二分变量相关指标时常用的方法。

为了更好地理解meta分析的原理，以下的部分将统一以唐金陵教授及同事1994年在英国医学杂志发表的系统综述的数据说明各种有关计算和分析。该研究是一篇关于尼古丁替代疗法戒烟效果的系统综述和meta分析，纳入了28篇评价有关尼古丁口胶戒烟效果的随机对照试验，并对数据进行了合并。本研究的主要原始数据见表3。下面将利用这些数据展示各种加权平均法meta分析的计算方法。

表3 尼古丁口胶戒烟效果随机对照试验的主要数据

二、倒方差法

在倒方差加权平均法，或称为倒方差法（inverse variance method，I-V法）里，效应量方差的倒数就是对应研究的权重。假设θ_i为第i个研究的效应量，θ可以是率比的对数值、比值比的对数值、率差、均数差或标准化均数差等，那么加权合并效应量可由以下公式表达：

其中w_i是第i个研究的权重，即效应估计值标准误平方的倒数，计算公式如下：

由于标准误与样本量成反比，相对于样本量较小的研究，样本量较大的研究因为标准误较小，在合并时往往会拥有较大的权重。

加权合并值或总体值的标准误的计算公式如下：

作为一种通用的meta分析方法，倒方差法可以用于表2中的所有结果和效应指标，应用范围远远超过其他方法。关于其他常用效应指标的标准误的计算，请参见表4。

表4 常用效应指标标准误的计算方法

注：SE=standard error; SD=standard deviation；式（4）中SD₁、SD₂分别为试验组及对照组的标准差，n₁、n₂分别为试验组及对照组的样本量；a_i、c_i分别为试验组及对照组发生结局事件人数；b_i、d_i分别为试验组及对照组未发生结局事件人数。

为了更好地理解倒方差法，现以表3中尼古丁替代疗法系统综述的数据为例，展示meta分析加权平均值及其可信区间的计算方法。表5列出了该系统综述中的28个研究的基本资料，包括样本量、疗效(OR)、OR的自然对数及其标准误SE[ln(OR)] 。另外w_i代表第i个研究的权重；w_i%为该研究的权重占所有研究总权重的百分比，反映该研究的效应值对总体效应值贡献的大小；w_iθ_i 是该项研究的权重和效应量之积，无实际意义，主要是为了进一步计算效应的点估计值使用。例如，第1项研究的标准误为0.289，其权重为11.93，占28个研究总权重的4.02%。合并的比值比的计算步骤如下：

合并ln(OR)的标准误为：

合并ln(OR)的95%可信区间（confidence interval，CI）为：

经对数转换后：

倒方差法的优势在于它的广泛适用性。对于待合并的单个研究来说，只要可以获得治疗估计值的标准误，就可以参与数据的合并。表4列举了几种常用效应指标的标准误的计算方法。倒方差法可以应用于多种数据类型和研究设计类型的效应量的合并，除前述的二分类变量和连续变量，还可用于合并标准化死亡率比、风险比、诊断试验、以及交叉试验和群组随机化试验中效应指标，也可以用于单组率和均数的合并。

表5 倒方差法计算研究的权重

和合并的效应指标示例

原文出处：唐金陵, 毛琛. 第三十一章: 系统综述中的统计分析. 见: 李立明主编. 流行病学. 第一卷. 第三版. 北京: 人民卫生出版社, 2015.

（本文是全文五个部分的第一部分，未完待续）