【原】真实世界研究：临床回顾性数据如何分析？请看两篇高水平论文的分析策略

妙趣横生统计学 2022-08-09 发布于浙江

展开全文

浙江中医药大学郑老师暑期核心课程“重复测量资料数据分析”即将开课，欢迎报名

Annals of Surgery，中文《外科学年鉴》，英文缩写是Ann Surg，是美国外科协会（American Surgical Association）、欧洲外科协会（European Surgical Association）、纽约外科学会和费城外科学会的官方杂志，创刊于1885年，全年出版发行12期。

作为世界外科学界的绝对权威，Ann Surg被誉为世界外科学领域的“圣经”。想发表一篇外科学年鉴的论文，非常不容易。

我们今天就来讨论下，2021年两篇在该杂志发表的两篇真实世界临床研究的论文，两篇回顾性临床研究的论文。来看看回顾性数据如何分析的？

当然，高水平论文分析方法也不见得高深莫测！

一、两篇论文介绍

第一篇

第一篇文章，比较的是机器人手术和腹腔镜手术治疗对直肠癌患者的影响研究。

这是一项回顾性队列研究，从2005年2月到2018年4月，共纳入600例接受微创手术的直肠癌患者。

患者分别接受过两种手术治疗方法：317例（52.8%）的患者接受机器人手术治疗，283例（47.2%）接受过腹腔镜手术治疗。研究希望探讨机器人和腹腔镜手术是否影响患者术后并发症的发生。该研究的主要目的探讨腹腔镜和机器人手术方法之间是否有术后并发症差异。

研究结局为住院时间(LOS)、30天再入院率、输血状况、术后肠梗阻、伤口感染、吻合口漏和总体并发症发生率。

结果发现，接受机器人手术的患者的总体并发症发生率较低(37.2%vs51.2%；P<0.001），输血需求较低（1.9% vs 7.8%；P<0.001）。两组患者的再入院率、肠梗阻率、吻合口漏率相似。中位LOS（3 vs5天；P<0.001）和延长LOS（21.45%vs43.11%；P<0.001）方面上机器人手术组更有利。

构建的并发症风险和住院时间延长（≥6天）的多变量模型显示，机器人手术是最能预防并发症的因素（OR 0.485；P=0.006）（表3）。并发症事件（OR 9.33；P<0.001）和转为开放性手术（OR 3.095；P=0.002是为延长住院时间的危险因素，而机器人手术(OR 0.62；P=0.027）是唯一独立的保护因素。

因此可以总体上说，在术后并发症发生率以及住院时间方面，机器人手术优于腹腔镜手术，即可改善患者短期结局。

第二篇

第二篇是咱们中国人写的！中国人民解放军总医院的刘荣教授牵头了一项回顾性的多中心研究，比较机器人胰十二指肠切除术（RPD）与开腹胰十二指肠切除术(OPD)在围手术期和肿瘤学方面的结果。中国人民解放军总医院的刘渠医生为文章的第一作者，刘荣教授为通讯作者。

2012年7月至2020年7月，研究者回顾了在中国的7个胰腺中心接受RPD（n=1032）或OPD（n=1154）治疗的连续患者的资料。

研究结局为手术时间（OT）、估计失血量（EBL）、输血、中转开腹、包括术后胰瘘（POPF）、胆漏（BL）、胃排空延迟（DGE）和胰切除术出血（PPH）在内的术后并发症、以及术后住院时间（LOS）和肿瘤病理确定、再手术率、90天再入院率和90天死亡率等。

结果发现，RPD组较OPD组估计失血量(EBL)更少(190.0 ml vs. 260.0 ml，P<0.001)，术后住院时间(LOS)更短(12.0天 vs. 14.5天，P<0.001)。手术时间(270.0 ml vs. 280.0 ml)相似。R0切除率相似，其他包括临床相关术后胰瘘(CR-POPF)、PPH在内的主要并发症发生率、输血、再手术、90天再入院或90天死亡率均无统计学差异(所有P值都>0.05)。

因此，作者认为，这项来自中国7个胰腺中心的队列研究发现，RPD与EBL更少和LOS更短显著相关。RPD组和OPD组在手术时间、临床相关术后胰瘘、胆漏、胃排空延迟、胰切除术后出血、主要并发症发生率、R0切除、再手术、90天再入院和90天死亡率均无差异。

二、它们的统计分析方法

真实世界研究用什么方法？来看看他们的统计学方法吧。

今天我把这两篇文章列在一起，因为这两篇论文采用真实世界研究两个最常见的统计学方法。

第一篇论文：

Continuous variables were described as mean (standard deviation) or median (interquartile range-range) as appropriate; categorical variables as frequencies and percentage. Significant differences between the 2 groups were tested by x2 or Fischer exact test for categorical variables and Student t test for continuous variables.

Univariate analysis for odds to any complication and LOS 6 days was performed by logistic regression for every confounder from our database; a multivariable model was built considering significant (P < 0.05) variables from the univariate regression; results are shown as odds ratio (OR) [95% confidence interval]. All tests were 2-sided, a P-value <0.05 was considered statistically significant. Analysis was performed using JMPPro (Version 13.0, SAS Institute, Cary, NC).

概括成中文就是：

（1）统计描述用均数标准差、中位数四分位数间距、率构成比；

（2）两组比较用t检验或者咖啡检验或者Fisher确切概率法；

（3）回归分析是logistic回归，先单因素（Univariate analysis ），后多因素（ multivariable mode），单因素后多因素的自变量筛选原则是单因素回归P < 0.05者纳入到多因素回归分析中。

第二篇论文

Normally distributed continuous data were presented as mean ± SD, and the Student’s t-test was applied to compare differences between groups. Non-normally distributed variables were presented as median with interquartile range (IQR), and the Mann-Whitney U-test was used. Categorical data were compared using the chi-squared test or Fisher’s exact probability test as appropriate. Logistic regression was applied for multivariate analysis.

中文的意思和第一篇类似：

（1）统计描述用均数标准差、中位数四分位数间距、率构成比；

（2）两组比较用t检验或者咖啡检验或者Fisher确切概率法；

（3）回归分析是logistic回归

但它们不是先单后多的方法，是倾向得分匹配：

To minimize the impacts of potential confounders and selection bias, propensity score matching (PSM)was used to compensate for differences in baseline patient characteristics between groups. A propensity score was calculated using logistic regression, and 1:1 patient matching was performed using the nearest-neighbor matching method without replacement. Variables such as age, sex, body mass index (BMI), American Society of Anesthesiologists (ASA) score, total bilirubin, carbohydrate antigen (CA)19-9, CA125, carcinoembryonic antigen (CEA), tumor location, vascular resection, and pathology were matched. A caliper radius equal to a standard deviation of 0.1 was set to prevent poor matching. Standardized differences were estimated before and after matching to evaluate balance, and a value of less than 0.05 indicated a balance between groups.

为了最大限度地减少潜在混杂因素和选择偏倚的影响，研究者使用倾向性评分匹配（PSM）来补偿组间基线患者特征的差异。使用逻辑回归计算倾向性评分，并使用最近邻匹配法进行 1∶1 患者匹配，无需替换。匹配的变量包括年龄、性别、体重指数（BMI）、ASA评分、总胆红素、CA19-9、CA125、癌胚抗原（CEA）、肿瘤位置、血管切除和病理。倾向得分卡钳值是倾向得分标准差的0.1倍，匹配后用标准化差值来反映匹配效果。

All statistical analyses were performed using SPSS v22.0 software (SPSS Inc., Chicago, IL). A p-value less than 0.05 was considered statistically significant. 所有统计分析均使用SPSS v22.0 软件进行，P值小于0.05被认为具有统计学意义。

于是，匹配前后样本量发生了较大的变化，均衡下得到明显改善。