分享

“十问石老师”答案揭晓!全球知名统计学专家手把手教你真实世界研究

 YLWUGD 2018-02-25

从我们收到的问题中可以发现,提问主要集中于以下3大类:① 关于真实世界研究样本量的问题;② 关于真实世界研究质控的问题;③  如何在我国开展真实世界研究?在这三大类问题中,剔除了重复问题后,石老师给出了回答。让我们一睹为快吧!







锡朝

“请教石老师,真实世界研究是否有最小样本量的要求?假如几项真实世界研究条件相似,能否用样本量去评价研究的效能。”


成成

“设计前瞻性真实世界研究时如何计算样本量?”



吴鹏杰

“真实世界研究样本量如何计算?如何利用真实世界证据来开展和撰写研究?”












































针对真实世界研究,研究者通常提出的第一个问题是“我需要多大的样本量来使得研究结果可信”。在这个问题之前,我认为更为源头的一个问题应该是——“研究者想要通过研究回答一个什么问题”——在我心中,这个问题比样本量重要的多。对我来说,研究假设(hypothesis)是否在临床实践、公共卫生等层面具有意义,是研究开展前最根源也是最重要的问题。

我们关注研究样本量的原因是什么?对于样本量,我们会开展样本量预测(sample size estimate)以及功效分析(power analysis),因为样本量的大小决定了研究结果对研究问题回答的精确(precise)程度。

举例来说,如果一项对比新药与传统药物疗效的研究样本量很小,结果显示疗效可从0.01%提高至99%。尽管从数据上看差距非常显著,但由于样本量小,其可能并不能作为临床高质量的参考证据。反之,另一项研究样本量足够大,结果显示新药疗效较传统药物从0.01%提高到0.03%。那在此基础上再评估结果的临床意义(clinical significance),就能够对临床提供一个更精确的参考意见。

一项研究多少样本量合适?这其实取决于在真实世界中,研究者选择了什么变量(variable)作为主要研究终点(primary endpoint)。如果一项研究选择了生存作为主要研究终点,那所需要的样本量就会比较大。如果一项研究选择的是连续变量(continues variable),例如高血压的下降,那样本量就可以比较小。

综上,样本量的大小取决于研究者所选择的outcome variable以及想要为研究问题提供多精确的回答。

必须强调的是,样本量所决定的是研究结果能多精确地回答研究问题,即研究的可信区间(confidential interval)多宽或多窄。但最为重要的问题,依然是研究问题本身的重要性。如果研究问题本身不够重要,数据再精准,对于临床而言可能意义也有限


2

关于真实世界研究质控的问题







徐骋

“真实世界研究建立在真实世界数据上,即真实临床环境下的各类型数据,然而这样的数据必然是非标准化、异质性大、偏倚多,得到的结果真实性和可靠性也会打折扣。您怎么看待真实世界研究的这个致命缺点?您认为大数据库能解决这个问题吗?”




成成

“如何控制真实世界研究质量是目前需要解决的问题。究竟怎样计算样本量和开展研究才能实实在在地反应真实?”



张波

“对于真实世界研究,有没有什么方法来判断一下自己样本的代表性怎么样?”




































我们做统计时,常说“garbage in,garbage out”。真实世界数据的来源包括医院的电子健康病历(EHR)、还没有建立EHR医院的手写病历、患者手机里健康相关数据、保险数据、随访资料等。如果研究者纳入研究的真实世界数据质量(quality)存在问题(garbage in),那即便用再好的统计方法计算结果,也依然无法获得高质量的结论(garbage out)。

反过来,为了保证数据的质量,我们在使用真实世界数据之前,应该先利用现行可用的quality control assessment评估数据是否一致(consistent)和可靠(reliability)。例如,如果我们注意到同一所医院第一个月的主要结果(major results)和第二个月的结果有很大的差别,我们需要考虑其中的原因,是否存在实验室的所采用技术的很大改变等。在研究中,我们需要花费时间关注这些问题,而不能急于求成,直接根据hypothesis去找数据然后很快就跳到研究结论(conclusion)。

正确的做法,是进行internal assess,用现行的评估方法,谨慎地评估真实世界数据的一致性(consistency)和可靠性(reliability)。目前在美国,几乎所有的顶尖医学院都使用了基于EPICS的数据库,目的就在于确保之后所使用的真实世界数据的可靠性。因为EPICS能保证进入的数据都self-control和self-checking,从而保证了数据的可靠性。

因此,我的建议是,在data analysis之前,应该先花时间来核实(verify)数据的一致性和可靠性


3

如何在我国开展真实世界研究







Doctor.Y

“目前发表的真实世界研究,国外的很多研究是基于医保和国家级数据库,在国内尚无此种数据库的情况下,只有区域性数据,如果要做药物疗效的评估,如何定义随访时间点的结局,如何判断某些患者的失访是病情好转没有来就诊,还是离开本地区?”













徐骋

“FDA专家认为真实世界研究并不排斥随机化和对照的实验设计,事实上ASPIRIN试验就是一个前瞻性随机对照的真实世界研究。这样庞大人群,长时间跨度随访的前瞻性真实世界研究适合在发达国家,尤其是发达小国(人口有限、居民社会福利高、具备完善的居民疾病数据库)实施。而在中国这样幅员辽阔,发展不平衡,数据量又十分巨大,但未建立可靠的国家级数据库的条件下,进行前瞻性真实世界研究必然有所掣肘。您认为我们能够在中国有条件地进行前瞻性随机对照的真实世界研究吗?开展中如何解决上述的问题呢?”








杨达伟

“对RWE研究领域非常感兴趣。想向您提的问题是:针对目前已有的RWE研究是否可以做类似的META分析,其效能是否和基于RCT研究的META分析相等或更强?另外目前是否有针对RWE研究设计的官方研究机构或者组织的网站数据入口,可以作为开放的注册入组病例的平台?”






周立中

我们知道了真实世界研究较RCT研究更接近与临床实践,因此增加了实用性和更大的数据样本量。但最近许多回顾性数据变身为真是世界的研究。请教:真实世界研究与回顾性研究的区别是什么?”


你若安好便是晴天

“能讲讲真实世界研究的实验设计吗?”



晓敏

“有没有真实世界研究发表在JAMA Oncol的杂志上?想学习和参考”



































































































真实世界研究在未来会越来越重要,因为真实世界数据,其后紧接的是实用主义(pragmatic)研究。

Pragmatic研究并非传统的临床研究,其目的是为临床决策提供帮助,例如,在临床上,对于同一状况,可能会有两种或两种以上的处理方式,而临床医生可能无法决断哪种方式更优,而pragmatic研究能利用真实世界数据,来解决医生的困惑。我相信,在未来,真实世界数据与pragmatic研究会是一对非常好的搭档,即在真实世界数据中寻找一个具有实用意义的研究假设,然后通过pragmatic研究,来解答临床上的实践疑惑

要在中国国内发展真实世界数据和开展分析,难以一蹴而就。开展的根本也是当务之急,是要建立一个可信的数据库——需要有一套可信赖的EHR数据。

国内医生面对医院的诸多数据(不同科室、不同部门的患者数据等),不知该如何利用这些数据来开展真实世界研究。这里面核心的问题在于,如何验证这些数据的质量避免garbage in,如何修正这些数据的质量,使其能够使用。

对此,我的建议是可以使用island method。Island method,顾名思义,就是在医院先创建一个孤岛式的数据库(island resource),然后分别去和独立的数据源相关联。举例来说,医院药房的数据库是一个独立数据源、手术室的数据库是另一个独立数据源,以此类推。不同的数据库之间可能并无相互关联及相互沟通,数据质量也不一样,如果不经校正,直接使用这些数据,那么必然难以避免garbage in。而通过建立island resource,将不同对数据源的数据纳入,将其标准化,评估数据的一致性及可靠性,完成质量控制后,医院就能具有island based的数据库,即质量过关的真实世界数据。数据库里经过筛选和验证后的数据,就可以为医生开展真实世界研究提供数据支持。

医生需要注意,开展真实世界研究所采用的数据常常为本院数据。可是医院数据与其地理位置等多种因素相关,很可能会存在偏倚(bias)。在这其中,最大的挑战就是其普适度不佳,即研究的结果并不适用于其他医院。对此,我有两点建议:  

我建议在开展真实世界数据分析(采用island method)时,采取策略联盟,即当医院决定开展一项真实世界研究时,需要与其他同级别的医院进行横向联合,或是从覆盖面上进行广度联合(例如从城市到乡村),来增加数据的代表性和普适性。

国内研究可以将关注点放在欧美发达国家并不常用但在国内普遍采用的特色治疗方式上,立足在中国具有特色的研究问题上,用国内的真实世界数据和研究解决国内临床的实际问题,我认为这非常重要,可以帮助国内学者将研究弱势转化为长处。

此外,关于真实世界研究能否开展meta分析,首先,Meta分析是指将以发表的文章的结果进行综合分析,来回答一个新的问题。在真实世界研究中,采用的是真实世界数据,不存在以发表的结果,是否可以开展meta分析?我认为可以。在真实世界研究中,通过采用数个真实世界数据库的数据,是可以用meta方法进行分析的。但在这其中,我的担忧是,大部分的数据本身就存在偏倚,如果不采用前瞻性随机试验,真实世界数据本身的偏倚,再加上meta分析本身的偏倚,可能会对研究结果产生很大的影响。因此,我个人认为,用真实世界数据开展meta分析不是一个很明智的选择

有问题提问如何开展前瞻性的真实世界研究,严格来讲,真实世界研究不存在前瞻性研究

但从开展角度来讲,可以利用真实世界数据开展前瞻性研究——研究者可以先在真实世界数据中找出自己的研究假设(hypothesis),然后根据这个假设,利用真实世界数据,开展pragmatic研究,为假说找出答案

最后,介绍真实世界研究的文章(包括我本人的)有发表在《新英格兰医学杂志》上,据我所知,目前尚无真实世界研究发表在最具影响力的几家医学学术期刊上。但我相信,未来会有很多真实世界研究发布出来。因为从2018年开始,美国顶级的医学院都使用了基于EPICS的数据库和标准化的EHR,随着这些的使用,海量的负荷标准的真实世界数据会产生,也会随之催生大量的研究。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多