分享

真实世界研究:临床回顾性数据如何分析?请看两篇高水平论文的分析策略

 妙趣横生统计学 2022-08-09 发布于浙江

浙江中医药大学郑老师暑期核心课程“重复测量资料数据分析”即将开课,欢迎报名

“重复测量资料分析方法”培训班(8.20-21)来了,两日学会,欢迎报名!

Annals of Surgery,中文《外科学年鉴》,英文缩写是Ann Surg,是美国外科协会(American Surgical Association)、欧洲外科协会(European Surgical Association)、纽约外科学会和费城外科学会的官方杂志,创刊于1885年,全年出版发行12期。

作为世界外科学界的绝对权威,Ann Surg被誉为世界外科学领域的“圣经”。想发表一篇外科学年鉴的论文,非常不容易。

我们今天就来讨论下,2021年两篇在该杂志发表的两篇真实世界临床研究的论文,两篇回顾性临床研究的论文。来看看回顾性数据如何分析的?

当然,高水平论文分析方法也不见得高深莫测!

一、两篇论文介绍


第一篇

第一篇文章,比较的是机器人手术和腹腔镜手术治疗对直肠癌患者的影响研究。



这是一项回顾性队列研究,从2005年2月到2018年4月,共纳入600例接受微创手术的直肠癌患者。

患者分别接受过两种手术治疗方法:317例(52.8%)的患者接受机器人手术治疗,283例(47.2%)接受过腹腔镜手术治疗。研究希望探讨机器人和腹腔镜手术是否影响患者术后并发症的发生。该研究的主要目的探讨腹腔镜和机器人手术方法之间是否有术后并发症差异。

研究结局为住院时间(LOS)、30天再入院率、输血状况、术后肠梗阻、伤口感染、吻合口漏和总体并发症发生率。

结果发现,接受机器人手术的患者的总体并发症发生率较低(37.2%vs51.2%;P<0.001),输血需求较低(1.9% vs 7.8%;P<0.001)。两组患者的再入院率、肠梗阻率、吻合口漏率相似。中位LOS(3 vs5天;P<0.001)和延长LOS(21.45%vs43.11%;P<0.001)方面上机器人手术组更有利。

构建的并发症风险和住院时间延长(≥6天)的多变量模型显示,机器人手术是最能预防并发症的因素(OR 0.485;P=0.006)(表3)。并发症事件(OR 9.33;P<0.001)和转为开放性手术(OR 3.095;P=0.002是为延长住院时间的危险因素,而机器人手术(OR 0.62;P=0.027)是唯一独立的保护因素。


因此可以总体上说,在术后并发症发生率以及住院时间方面,机器人手术优于腹腔镜手术,即可改善患者短期结局。

第二篇

第二篇 是咱们中国人写的!中国人民解放军总医院的刘荣教授牵头了一项回顾性的多中心研究,比较机器人胰十二指肠切除术(RPD)开腹胰十二指肠切除术(OPD)在围手术期和肿瘤学方面的结果。中国人民解放军总医院的刘渠医生为文章的第一作者,刘荣教授为通讯作者。


2012年7月至2020年7月,研究者回顾了在中国的7个胰腺中心接受RPD(n=1032)或OPD(n=1154)治疗的连续患者的资料。
研究结局手术时间(OT)、估计失血量(EBL)、输血、中转开腹、包括术后胰瘘(POPF)、胆漏(BL)、胃排空延迟(DGE)和胰切除术出血(PPH)在内的术后并发症、以及术后住院时间(LOS)和肿瘤病理确定、再手术率、90天再入院率和90天死亡率等。
结果发现RPD组较OPD组估计失血量(EBL)更少(190.0 ml vs. 260.0 ml,P<0.001),术后住院时间(LOS)更短(12.0天 vs. 14.5天,P<0.001)。手术时间(270.0 ml vs. 280.0 ml)相似。R0切除率相似,其他包括临床相关术后胰瘘(CR-POPF)、PPH在内的主要并发症发生率、输血、再手术、90天再入院或90天死亡率均无统计学差异(所有P值都>0.05)。

因此,作者认为,这项来自中国7个胰腺中心的队列研究发现,RPD与EBL更少和LOS更短显著相关。RPD组和OPD组在手术时间、临床相关术后胰瘘、胆漏、胃排空延迟、胰切除术后出血、主要并发症发生率、R0切除、再手术、90天再入院和90天死亡率均无差异。

二、它们的统计分析方法


真实世界研究用什么方法?来看看他们的统计学方法吧。

今天我把这两篇文章列在一起,因为这两篇论文采用真实世界研究两个最常见的统计学方法。

第一篇论文:
Continuous variables were described as mean (standard deviation) or median (interquartile range-range) as appropriate; categorical variables as frequencies and percentage. Significant differences between the 2 groups were tested by x2 or Fischer exact test for categorical variables and Student t test for continuous variables. 

Univariate analysis for odds to any complication and LOS 6 days was performed by logistic regression for every confounder from our database; a multivariable model was built considering significant (P < 0.05) variables from the univariate regression; results are shown as odds ratio (OR) [95% confidence interval]. All tests were 2-sided, a P-value <0.05 was considered statistically significant. Analysis was performed using JMPPro (Version 13.0, SAS Institute, Cary, NC).

概括成中文就是:
(1)统计描述用均数标准差、中位数四分位数间距、率构成比;
(2)两组比较用t检验或者咖啡检验或者Fisher确切概率法;
(3)回归分析是logistic回归,先单因素(Univariate analysis ),后多因素( multivariable mode),单因素后多因素的自变量筛选原则是单因素回归P < 0.05者纳入到多因素回归分析中。

第二篇论文
Normally distributed continuous data were presented as mean ± SD, and the Student’s t-test was applied to compare differences between groups. Non-normally distributed variables were presented as median with interquartile range (IQR), and the Mann-Whitney U-test was used. Categorical data were compared using the chi-squared test or Fisher’s exact probability test as appropriate. Logistic regression was applied for multivariate analysis. 

中文的意思和第一篇类似:
(1)统计描述用均数标准差、中位数四分位数间距、率构成比;
(2)两组比较用t检验或者咖啡检验或者Fisher确切概率法;
(3)回归分析是logistic回归

但它们不是先单后多的方法,是倾向得分匹配:
To minimize the impacts of potential confounders and selection bias, propensity score matching (PSM)was used to compensate for differences in baseline patient characteristics between groups. A propensity score was calculated using logistic regression, and 1:1 patient matching was performed using the nearest-neighbor matching method without replacement. Variables such as age, sex, body mass index (BMI), American Society of Anesthesiologists (ASA) score, total bilirubin, carbohydrate antigen (CA)19-9, CA125, carcinoembryonic antigen (CEA), tumor location, vascular resection, and pathology were matched. A caliper radius equal to a standard deviation of 0.1 was set to prevent poor matching. Standardized differences were estimated before and after matching to evaluate balance, and a value of less than 0.05 indicated a balance between groups. 
为了最大限度地减少潜在混杂因素和选择偏倚的影响,研究者使用倾向性评分匹配 (PSM) 来补偿组间基线患者特征的差异。使用逻辑回归计算倾向性评分,并使用最近邻匹配法进行 1∶1 患者匹配,无需替换。匹配的变量包括年龄、性别、体重指数 (BMI) 、ASA评分、总胆红素、CA19-9、CA125、癌胚抗原 (CEA)、肿瘤位置、血管切除和病理。倾向得分卡钳值是倾向得分标准差的0.1倍,匹配后用标准化差值来反映匹配效果。
All statistical analyses were performed using SPSS v22.0 software (SPSS Inc., Chicago, IL). A p-value less than 0.05 was considered statistically significant. 所有统计分析均使用SPSS v22.0 软件进行,P值小于0.05被认为具有统计学意义。
于是,匹配前后样本量发生了较大的变化,均衡下得到明显改善。

三、哪种方法更合适?


真实世界研究推荐用哪种方法?

多因素回归还是倾向得分方法?

(1)回归分析,先单后多,单因素P<0.05的自变量纳入多因素回归模型,是没有问题的。

(2)倾向得分当然很主流,现在真实世界研究好像不用倾向得分匹配就统计思维落后了似的(当然不是)

(3)统计学的方法,没有绝对的正确或者错误,只有合适与否!你要问我用哪种方法?如果样本量或者阳性结局事件较少,则推荐用倾向得分匹配。如果样本量足够大,回归足矣。

(4)开展真实世界研究,关键不是统计学方法,而是设计与实施。回顾性临床设计,也要符合队列研究设计思路,很多人开展回顾性队列研究,做成病例对照研究,那是非常不合适的!

(5)当然,数据就得真实了,我们很多做临床试验,做真实世界研究,数据假得不行,连自己都看不下去,怎么能够得到别人认可呢?如果能够发表文章到“外科学圣经”呢?

统计课程通知

2022年,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班,包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS临床试验数据分析、重复测量资料分析结构方程模型等9门课。如果您有需求,不妨点击查看:
2022年9门科研培训课程通告:总有一门你能学的。无限次直播,每周答疑!

更多信息

本公众号作为医学数据分析公众号,提供一些免费医学统计学学习资源下载,欢迎点击下载。
1.免费下载!统计初学者的福音!《妙趣横生统计学》视频,生动有趣的统计学!
2.样本量计算器,免费下载使用,手把手教你计算样本量!
3.绝对值得收藏!原创高清SPSS 操作视频免费下载
4.推荐!这个流行病大神制作的公共卫生研究小工具,可以计算标准化率及置信区间
5.【绝对精品】这套954张PPT的医学统计学教程,现在公开赠送!
6.精制原创11讲短视频下载!零基础者2小时掌握医学统计学基本原理
7.2022年如何学习医学统计学?无偿奉上我们精心制作的医学统计学全套资料
8.超级好用的统计思维导图来了!一步步告诉你如何选择合适统计方法
特别提醒:上述资源每天限分享和下载一个

最后,
如果您觉得不错的话,
可否点击分享推文到朋友圈呢?

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多