分享

实验结果不可重复?看大牛们是怎么做的

 解螺旋 2020-08-27

作者:Gordon J. Lithgow, Monica Driscoll& Patrick Phillips

作者:麦子

转载请注明:解螺旋·临床医生科研成长平台


生物实验的可重复性问题一直困扰着研究人员,从刚起步的研究生到发表过顶级杂志的优秀学者。刚刚消停的韩春雨的故事(《韩春雨主动撤稿,河北科技大学启动调查》)就这样令人唏嘘。

他说将在第三方实验室的协助下尝试排查不可重复的原因。但其实一年来这么多实验室都尝试过了,他也没有公布当初“成功”的那份详细操作流程或质控方案来协助排查,也没能公布原始数据,实在遗憾。

难重复的问题的确常见,但常见不等于正常,认真面对并寻找解决办法才是正途。前段时间统计学家们讨论过的P<0.05的门槛也许太低了,导致假发现太多(《P值“大佬”地位恐不保,统计学大牛齐发难》),也是可重复性差的一个可能原因,希望能帮助解决行业内这个普遍存在的问题。

最初提出NgAgo无法编辑基因的一位学者GaetanBurgio表示,这事到这就结束了,他要忙自己的事了。但我们也看到还有许多学者在期待他能翻盘,希望“时间能证明一切”。

然而我又要给一碗毒鸡汤——时间不能证明任何东西,能证明的是这段时间内所采取的措施。如果要继续关注这事,则希望能看到他的具体措施。

近期Nature上有一则研究衰老干预的实验难以重复的故事,为了排查原因,研究者们对操作流程的控制可以说苛刻到了“变态”的程度。他们的经验或许可以给我们提供一些参考和激励。

◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆

为了重复出那个结果,我们花了4年,用掉10万线虫,不过有了惊喜的发现。Gordon J. Lithgow,Monica Driscoll和Patrick Phillips解释说。

——题记

大约15年前,我们仨的其中一人(G.J.L.)接到了一位同事及合作者的电话,那个电话让人很不爽。说,在近一年的令人沮丧的实验后,这位同事准备要发篇文章来陈述他的组不能重复我们的一篇主流杂志(Science)上的文章的结果了。 

这份研究是第一次清楚地说明某个类药分子可能延长一种动物的寿命。我们一次又一次地确认治疗延长了线虫寿命,最长可达67%。可无数电话和邮件讨论也没能确定为什么这么简单的实验会在不同的实验室得到不同的结果。

然后另一家实验室也说无法重复我们的结果。尽管做了更多实验、发了更多文章,我们还是没搞清楚为什么各家实验室会弄出不一样的寿命结果。直到现在,我们也还没弄明白。

几年后,相同的情景又在其他实验室上演,不过是其他的化合物。差不多同一段时间,业内正在对红酒中的白藜芦醇是否能延长实验动物的寿命而吵得不可开交。

药物延缓衰老的可能性催生了一批企业和科研细分领域,但在这个江湖翻腾久了终于意识到,稳定的延寿效果是很难重复的。

本来衰老研究为了撇清自己跟伪科学的关系已经奋战了许多年,但德高望重的实验室的成果也难以重复,又让巫术的影子得瑟起来,显得前途更虚无了。这还有一个令人心寒的后果:有些研究者(包括G.J.L.)已经停止了此类药用化合物的研究许多年了。

尽管如此,也还有很多文章陆续发表,声称某种化合物能延缓衰老。基本没什么人重复。到了2013年,我们三个担起了这个一点也不讨喜的重任。

我们确实没搞定文献报道不一致的问题。但追踪了10万多只线虫个体的寿命之后,我们终于知道,理解不同实验室、不同实验轮次之间差异的来源是多么重要。我们甚至看到了新的生物学现象,有可能解释那些不一致。

更广泛的问题

要提高可重复性,通常来讲是要完整记下实验方法。研究自噬(细胞清除降解产物的过程)的科学家们就有很多这方面的合作和努力,来制定并更新相关指南,比如说怎样认定某种复合物被吞噬了,或者怎样验证某个基因参与了这个过程。

另一个比较有名的例子是,两个实验室花了一年多来试图理解矛盾。科学家们并肩作战,对同样的肿瘤活检追究他们分离细胞的方式之间的小差别——正是一个用力搅动、一个长时间轻轻摇晃,造成了不同的结果。

 

细节,一直以来都是让生物实验能顺利运行所要关注的重点。除了普通实验购买试剂盒的选择外,还听说有个课题组从一个机构转到另一个机构时,要把蒸馏水也运过去,整个组还要花费数月来调试新机构的用水条件,直到实验像在老地方一样work起来。

差异的来源包括试剂的质量和纯度,微环境的日常扰动,以及研究者所采用的特殊技术。我们要出错有这么多条路可以走,也许应该对实验可重复的竟有这么多而感到惊喜吧。

那些年,那些虫子

有个专注于衰老研究中的不一致性问题的组织,即NIH下属的美国抗衰老协会(NIA)。毕竟,NIA资助了那些研究,也意识到它们的结果应该像焊铁一般牢固。

NIA有个成功的故事。它的干预检测项目曾经发现,通过一个普通的protocol,雷帕霉素能在三个独立实验室中延长小鼠寿命。以同样的理由,NIA启动了秀丽隐杆线虫干预检测项目,并把这个任务交给了我们——来自不同领域的三个专家,之前也没合作过——要我们系统地检测秀丽隐杆线虫的衰老干预研究。 

实验室中,这些虫子在琼脂平板上生活,饲以活细菌。待检测的化合物混进了琼脂或饲料中,寿命就以死亡时间来评价——如果用金属丝戳它一下它动了,噢耶活着。这个技术被研究虫子的研究人员们使用了超过25年。我们的第一个任务就是制定一个protocol,看起来简单易行。

但细微的差异是无穷无尽的。在一个特别痛苦的电话会议中,我们花了1小时来争辩怎样才是把虫子捞起来放到另一个琼脂板上的正确姿势。有些虫子会和更为温柔的技术员相处一整天,但由于线虫的寿命也就是20来天,这个问题就大了。

上百封邮件和电话之后,我们终于对一种操作流程达成一致意见,但最终还是有3天寿命差,阴魂不散地萦绕在实验中。最后才发现,这是记录的bug,一个实验室从虫卵孵化开始记时,另一个却从虫卵被产下时开始记虚岁!

我们还决定从一开始就买同一批试剂共享。合作真是个噩梦。我们跟供应商谈清楚,要给我们提供同一批货号的试剂,更换也要同时。我们的虫子以及它们的食物都共属同一个品系,还有严苛的操作规范。我们建立的protocol甚至包括烧瓶在高压蒸汽灭菌器中的精确摆放位置,还同时、从同一个厂家购买孵化器。

我们还要处理大量数据,把来自各个实验室的数据导入一个单一数据集。我们还写了个iPad app,让检测指标能直接录入系统,而不是先记到纸上过后再誊进去。

这个app也督促我们完整记录每个琼脂平板上的线虫的详细信息,也确保了每个实验的数据和元数据都能被校对(比如说品系名称MY16和my16是不一样的)。这个简单的操作也消除了记录的误差,以免对统计分析造成麻烦。

这个系统建立后,实验室之间的差异变小了。经过一年多的预实验,以及锱铢必较的方法细节讨论之后,我们几乎完全消除了实验室之间线虫寿命的系统差异。

 

我们的数据还提示了另一个惊人的差异来源。即便在同一个实验室中进行着看似一致的实验,我们也没法消除实验轮次之间的差异。几轮下来之后我们才意识到,有几批线虫可能会分出两种衰老模式,即长寿型或短命型。

原因目前还不清楚,不过这个发现也提示我们,如果要理解一个化合物的作用,我们需要重复的实验可能比我们以为的要多得多。同时还要考虑线虫的数量及所做的独立实验次数。

在这个背景下,我们开始检测化合物的作用。为了探查遗传背景的影响,我们用了许多个线虫品系。秀丽隐杆线虫(C. elegans)和双桅隐杆线虫(C. briggsae)在显微镜下看起来可能很像,但遗传学上他们就跟鲸和蝙蝠一样明显。

我们的结果令人兴奋,也让人清醒。抱着希望,那些化合物能在不同的遗传背景下延长寿命,那它就是个好苗子。(小蠕虫们也渐渐会被用来研究能在人体应用的延长寿命药物。)我们找到了这么一个化合物,其延寿效果能跨越所有种系。其他大多数只能跨越两三种,对其他种系来说还通常有害。 

这个现象还引发了一系列有意思的机制问题,也许有助于解释遗传因素对个体应答衰老干预药物的影响。

其他的差异可能来源于生存分析方法上的小差别。孵化器和实验室温度的轻微波动以及食物的质量可能都会有重要的影响。

真的极少有哪个项目会如此精确地探究方法上的差异。事实上,好几个使用小鼠做研究的学者还提出,标准化反而不利于达成目的,关注点应该更多地放在追求不同条件下取得的结果,而不是追踪仅在有限的参数下才能出现的零碎的发现。

我们则提出另一条出路,即追踪差异的来源,再放到普通环境中去理解它。我们现在正合作,探寻同一品系的虫子分化出长寿与短命两种模式的分子差异,这个现象要不是追溯并消除了几乎所有的变异来源,我们是肯定发现不了的。

这也是我们的一个经验教训,要理解生命如何运行,那么描述清楚研究是怎么做出来的,跟描述观察到了什么现象一样重要。

参考资料:http://www./news/a-long-journey-to-reproducible-results-1.22478#/b8

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多