【原】做观察性研究，你该避免这些失误

解螺旋 2020-08-27

展开全文

转载请注明：解螺旋·临床医生科研成长平台

观察性研究算是一种经济实用的医学研究类型，尤其是回顾型研究，堪称医学科研起步神器。当然也有多中心大样本、由大专家主持的，不过剥开来都一个样，就是数据的统计处理在其中的分量比其他类型的研究要重一些。

数据的处理自然有很多需要注意的地方，下边来说说最常见的五种。

慎重转换数据类型

很多种观察指标都容易发生这种事情，比如血红蛋白，可能你收集数据的时候还是原始的xx mg/dL，但进入统计时又会根据诊断标准变成正常、轻度贫血、中度贫血、重度贫血、极重度贫血这样的分类（等级）变量。类似的还有BMI、肌酐、各种量表的评分等等。

这不能说是严重错误，但的确不好，放弃了很多信息，就像把一张彩色照片弄成了黑白照片。这样在计算时就会失去效应量，也就会影响到统计显著性、统计功效等重要指标，从而给读者造成误导。曾有模型分析指出，将连续变量变成二分类变量，失去的统计功效相当于丢掉1/3样本。

处理好混杂因素

观察性研究中，混杂因素的识别和控制一直是个老大难问题，你以为某效应是某因素造成的，其实还有其他因素从中做梗，许多有争议的研究结果都可归咎于此。最好是在课题筹备期间多做调查，尽量把可能的混杂因素都考虑到，并选用恰当的统计方法来处理，比如倾向评分匹配法（PSM）。

不过还有一种关注较少的混杂因素，叫时间依存性混杂因素（Time varying confounders）。某个混杂因素受前期暴露因素的影响，又会随时间而变化，其对结局指标的影响强度也随之变化，此时若研究者把它当成固定变量去处理就不好了。

不过对时间依存性混杂因素该如何处理，医学上的讨论还不多。近期BMJ上有篇文章提醒大家注意这种混杂因素，并介绍三种方法可对其造成的偏倚进行校正，包括逆处理概率加权法、参数化G公式、G估计值，三者统称G方法（G method）。

当心趋中回归现象

趋中回归（Regression toward the Mean，RTM）这个统计学概念是生物学家Francis Galton提出的，其实相当常见，常见到容易忽视。某个变量中有个极端值，在后续测量中则很有可能趋向于分布频率更高的平均值，有点像正态分布的概念。

如果我们选择病例时选择了极端值区间（比如很低的血红蛋白、很高的前列腺特异性抗原等），在治疗后再次测量时有可能得到趋向正常值的结果，这时就很容易误以为是治疗的效应。

为了避免这种误会，设置对照是必要的。其次，可以在分析阶段使用协方差分析（ANCOVA），看看基线数据是否也会对结果造成影响。另外，如果是前瞻性研究，还可以在纳入受试者时就多做几次测量，就像平时测血压都要测至少两次那样。

留意竞争性风险

有时候，几个风险因素对于结局指标来说是有竞争关系的。比如观察结肠癌术后恶化的风险，有些病例却在发生结局事件之前而由于别的原因死亡（比如老死）。这时如果把这些病例删除就可能造成误导。

这类研究中常用的Kaplan-Meier分析是基于这样的“事实”：虽然受试者死了，但如果他活得够长其实也有可能发生我们所观察的结局事件。有学者担心这会高估事件的发生率，尤其当竞争风险件并非独立的时候。

更甚者，我们可能得出错误结论。曾经有大型病例对照研究观察到吸烟对黑色素瘤看起来似有保护作用。一个较有可能的解释便是竞争性风险，吸烟相关的疾病造成的死亡阻止了黑色素瘤的发生。

如果课题中存在竞争性风险时，可做竞争性风险回归（Competing Risk Regression，CRR）分析。

缺失数据的处理

有些病例会有某几个观察指标没收集到，这是很常见的，尤其是回顾性研究。这些数据处理不当造成的偏倚是很复杂，也很难检测的。虽说最好的办法是在收集阶段控制好数据的缺失，但回顾性研究肯定会有收集者不能控制的历史原因。

所以在研究报告中汇报这些缺失数据就很重要，最好还能分析缺失的原因，比如，缺失的随访记录如果跟所观察的治疗方法的不良反应有关，那显然隐而不报的话是不利于该疗法的收益风险评估。

在统计技术上，对缺失值其实也还没有完全公认的解决方法。常见的是删除整个样本，但这样可能造成统计功效下降，更有可能因删除了有不良反应的样本而高估了临床收益。

还有一种近年来得到较多支持的技术叫多重插补法（multiple imputation），其基本思想就是根据插补模型去随机填上缺失数据的坑，得到一个“完整”的数据集，多填几次，得到几个“完整”数据集，将统计方法应用到这些数据集上，通过整合结果给出估计结果。

不过也有学者抵触这种做法，觉得虚拟没有记录到的数据令人不安。其实可以这样看待，多重插补法是通过修补来保护那些有价值的数据。但无论何如何，在写protocol和最后汇报时要把缺失值的处理方法也写清楚。

参考资料：

1. Carmona-Bayonas, A. et al. Top ten errors of statistical analysis in observational studies for cancer research. Clin Transl Oncol (2017).

2. Hayati Rezvan, P., Lee, K. J. & Simpson, J. A. The rise of multiple imputation: a review of the reporting and implementation of the method in medical research. BMC Med Res Methodol 15, 30 (2015).

3. Mansournia, M. A., Etminan, M., Danaei, G., Kaufman, J. S. & Collins, G. Handling time varying confounding in observational research. BMJ 359, j4587 (2017).