分享

生命编码背后的故事(五十)

 医学abeycd 2023-04-17 发布于湖北

1997年3月,美国纽约州西北部偏僻的布法罗市报纸上出现一则不那么起眼的小广告,征求20名志愿者参与人类基因组计划。在简短阐述这个项目的科学意义后,广告解释他们需要的是血液样品。每位志愿者只需捐献一次,可以得到一小笔报酬。为保护隐私,全部样品都将以匿名形式保存使用,不会泄漏志愿者的个人信息。



人类基因组计划招募志愿者的广告

对于人类基因组计划而言,这是一个他们期盼已久的时刻。在1990年10月1日正式启动的六年半之后,他们按部就班进入原定计划的第二阶段,由招募志愿者着手开始针对人类基因组的测序工作。

那年一月,隶属于国立卫生研究院的人类基因组研究中心又换了个名字,改称“国家人类基因组研究所”¹。这个微妙变化意味着他们的地位又一次得到提升,不再只是一个临时性的“中心”。国立卫生研究院内早已有着名目繁多的研究所。人类基因组计划终于有了与它们平起平坐的资格。

其实,无论是叫做中心还是研究所,这个政府部门只是一个高高在上的管理机构,自身并不从事科学研究。传统上,美国政府资助的基础科学项目由分布各地的大学承担,人类基因组计划也不例外。还在国会通过拨款之前,十几所大学已经相继成立专门的测序中心。他们既跃跃欲试地准备共襄盛举,同时也不错过在这个大科学项目中分得一杯羹的机会。柯林斯和他的中心或研究所的职责便在于统一筹划,将国会提供的资金和科研任务分配给这些大学里的测序中心以及其它科研组织。

在那些大学校园之外,美国能源部也还保留着自己的基因研究所和来自国会的直接拨款。虽然他们是最早鼓动为人类基因组测序的先行者,但在沃森出面掌管人类基因组计划后已经失去领袖地位,与各大学的测序中心一起接受柯林斯和国立卫生研究院的任务分配。

在英国,由惠康基金会资助的桑格中心是美国之外规模最大的测序实验室。桑格中心的主任苏尔斯顿(John Sulston)雄心勃勃,意欲独力负责人类基因组三分之一的测序。在沃森的软硬兼施和争议之中,德国和日本最终也加入了测序的行列。它们与法国一样,投资和测序规模相对而言小得多。这些国际合作也都是在柯林斯的督导之下进行。

这是一个庞大而有序的国际科研大合作。但在这一切有条不紊的组织和进展背后,柯林斯却还是忧心忡忡。


在1992年离开国立卫生研究院后,文特尔终于有了完全属于自己的舞台,可以随心所欲地大展身手。他一口气购置几十部价格不菲的自动测序机器,在实验室里整整齐齐地排列开来,布置得更像是一个工厂的车间。身着白大褂的工作人员宛如纺织工人在机器间来回穿梭,不停地为它们添加原料,输入、更改指令。这些年轻人基本上都是大学生物系的新科毕业生,在这里从事着正是沃森眼中“猴子都能胜任”的简单重复性操作。在文特尔的部署指挥下,他们和那些不知疲累的机器每天都能兢兢业业地测定出数以十万计的碱基对序列。

当然即使如此高效率的速度与人类基因组30亿碱基对的测序需求仍然相去甚远。不过文特尔和他身后的投资者并不介意。由于文特尔“投机取巧”的cDNA策略,他们测定的都是具有实际意义的外显子序列。²这些序列的绝大多数会及时发布,以公开的数据库形式提供给全世界分子生物学家浏览、分析。日益增长的数据库很快成为搜寻致病基因不可或缺的参照数据。通过发掘其中的宝藏,分子生物学家在很短的时间内即成功找到导致结肠癌和老年痴呆症的基因,与过去那动辄需要十多年的艰辛形成鲜明对比。在那个1990年代初,兴师动众的人类基因组计划还远远没有开始基因测序。文特尔和他的数据库一枝独秀,先声夺人地引领基因科技的新潮流。

1993年底,生物化学家史密斯(Hamilton Smith)在一次学术会议上找到文特尔。相比于初出茅庐的文特尔,比他年长15岁的史密斯早已声名远扬。他在1970年分离出一类后来在基因克隆中大显身手的限制性核酸内切酶,一举赢得1978年的诺贝尔生理学或医学奖。不过功成名就后的史密斯时运不济,科研事业大幅滑坡,及至十多年后甚至无力获取国立卫生研究院的资助,沦落为学术界被遗弃的边缘人。这时他有一个新想法,可以大大加快DNA测序的速度。但他没法说服自己大学里的同行,不得不找到文特尔另谋出路。恰好文特尔那时也已经不再满足基于cDNA的部分测序,正摩拳擦掌地准备向基因组的完整测序发动正面进攻。两人在酒吧会面后一拍即合,文特尔当即聘请史密斯加入他的实验室。

史密斯的想法其实很简单,也并非新颖。他认为在为DNA测序时不需要沿着双螺旋的一个个梯级循序渐进地测定其中每一个碱基对。他们可以利用酶将需要测定的序列随意切割,使之变为成千上万的碎片。每个碎片都是比较小的DNA片段,可以同时地在机器中自动克隆和测序。这样测出的每个序列都是原来DNA碱基序列的一小部分。借助计算机的帮助,他们可以寻找出碎片彼此之间的重叠部分,将碎片的序列连接起来得到整体的DNA序列。

这其实就是桑格最早测定蛋白质的氨基酸序列所用的手法。那时桑格将胰岛素的氨基酸序列随机切割成只带有两三个氨基酸分子的碎片,单独测序后再利用碎片之间的重叠还原出胰岛素的整个氨基酸序列。20多年后,他曾试图在DNA测序中如法炮制。但DNA中碱基序列的数目要比蛋白质中的氨基酸数目大得多。同时,氨基酸有20种不同类别。DNA的碱基序列只有四种,无法构成足够的不同排列组合来分辨不同碎片间的重叠。桑格和吉尔伯特后来是分别找到不同的新办法才解决DNA的测序难题。因此,当史密斯旧话重提,要以将DNA序列切碎的方式测序时,不仅他象牙之塔中的同行不屑一顾,即使在文特尔的公司内也乏人认可。

但时代已经不同了。在桑格和吉尔伯特的DNA测序之后的十多年里,基因科技不是唯一大踏步前进的新兴产业。计算机行业也已经异军突起,正在颠覆各行各业的既定运作模式。虽然身为年过六旬的生物学家,史密斯对这个新趋势深感兴趣。他亲自学习编写计算机程序,用模拟手段证明计算机完全有能力同时处理大量被随机切碎的DNA序列片段数据,找出它们之间的重叠关联而还原出DNA的碱基序列。

不过,这个测序方法无法保证他们能够获得被测DNA序列的所有碎片。如果某些碎片在实验中没能被发现,最后测得的DNA碱基序列势必会留下未知的缺口。填补那些空隙的后期工作也许会更为艰难。这个缺陷与文特尔利用cDNA测序的“投机取巧”如出一辙。不出所料,沃森、柯林斯等主流生物学家对这个被命名为“霰弹枪测序法”³的手段又一次深恶痛绝,认为那是一个名副其实的野蛮途径。

在一片反对声音中,早已习惯剑走偏锋的文特尔不为所动。他尤其欣赏史密斯的大胆创新精神,毫不犹豫地提供人力物力的支持。在对付庞大繁复的人类基因组之前,他们决定先为简单得多的细菌DNA测序作为可行性实验。史密斯挑选的是他早已熟悉的流感嗜血杆菌(Haemophilus influenzae),其整个基因组由大约180万个碱基对组成。

一切准备就绪后,文特尔和史密斯特意在1994年初联名向国立卫生研究院提交一份资助申请。文特尔当然不指望他这个前雇主会为他慷慨解囊,这只是他存心促狭的一个步骤。大半年后,他们不出所料地收到一份拒绝信。为申请做评议的同行很认真地表述他们的反对意见:为多达180万碱基对的基因组完整测序在目前尚属不可能之举。文特尔和史密斯接到信后开怀大笑。那时,他们已经顺利完成了这个不可能任务的90%。

当文特尔随后在1995年5月的一次学术会议上宣布流感嗜血杆菌的基因组已经被完全测出时,分子生物学界为之震惊、轰动。这是人类第一次掌握一个自主生命体的全部基因,有机会全面地阅览生命的编码,窥探内中秘密。

18年前,桑格完整地解析出一种噬菌体的DNA序列,开创DNA测序纪元。噬菌体是病毒。它们无法自我繁殖,只能依靠细菌作为宿主完成自身的复制,因此算不上独立的生命。流感嗜血杆菌则不然,作为细菌是一个完全自我生存、繁殖的自主生命体。而且,桑格所测得的噬菌体基因组只有5000多个碱基对,与拥有将近200万碱基对的流感嗜血杆菌不可同日而语。即使沃森也不得不感叹流感嗜血杆菌基因组的测定是“科学的一个伟大时刻”

精确而言,流感嗜血杆菌的基因组中共有183万零137个碱基对,其中含有1743个基因。这些基因中的1000多个并非该细菌独有。它们与其它生物体中已经发现的基因或者完全相同或者高度类似。这正是进化论的体现:不同物种的生物体内存在大量相同或近似的基因正是它们有一个共同来源——达尔文生命之树的根——的生动写照。通过不同物种之间的对比观察,这些基因所产生蛋白质的功能可以很容易地分辨、归类,极大地扩展人类对基因的认识。

对于文特尔来说,他最大的收获莫过于这一成功雄辩地证明“霰弹枪测序法”的行之有效。尤其显著的是,测定流感嗜血杆菌的180多万碱基对序列花了一年半时间和大约一百万美元的投资。这几乎只是吉尔伯特估算的、已经成为分子生物学界共识的一美元一个碱基对预算的一半。在生物学家在圣达菲讨论测定人类基因组可能性的近十年之后,那个宏伟的目标已经不再是梦想。

而流感嗜血杆菌基因组测序也不只是一次预演。细菌基因的认识对传染病、疫苗研究至关重要。在其后的几年中,文特尔的实验室开足马力,继续为更多的微生物进行基因组测序。当然,文特尔也没有忘记他的初衷:人类的基因组。


1996年2月底,尚未升级的人类基因组研究中心与惠康基金会联合举办第一届人类基因组测序战略的国际会议。一年之后,他们将公开招聘捐献血样的自愿者,正式开启为人类基因组测序的攻坚战。为了那个即将到来的时刻,柯林斯邀请人类基因组计划各个实验室的领军人物共商大计。会址选择在位于大西洋之中、介于美国和欧洲之间的百慕大海岛。来自世界各地的40多位生物学家在风景怡人的岛上济济一堂,满怀着憧憬和兴奋探讨下一步的计划和挑战。

至少他们在人类基因组信息的归属上不再有公开的分歧。在一次讨论会上,桑格中心主任苏尔斯顿提出基因测序的三项原则:新测出的DNA序列应该在24小时内公诸于众;分析完毕的序列也必须及时发表;尽力保证整个人类基因组的序列信息属于公有领域,方便世界各地的科研人员免费获取。



苏尔斯顿在百慕大会议上引导讨论基因测序原则时的手写板书

这是一组追求快速、无偿分享基因测序成果的原则。与会者没有异议,一致通过了这个“百慕大原则”。他们之中包括被普遍视为“叛逆”的文特尔。

在那次会议上,另两位研究者的报告也得到与会者的一致反响,只是效果截然相反。文特尔和史密斯在流感嗜血杆菌基因组测序的成功终于引起同行们对霰弹枪测序法的兴趣。不过流感嗜血杆菌基因组的测定固然是一个显著的突破,它们那183万碱基对与人类基因组的30亿碱基对相比仍然只是九牛一毛。假如故伎重演,用霰弹枪测序法对付庞大繁杂的人类基因组,计算机程序能否可靠地找出碎片之间的重叠,最后测得的序列中会遗留多少缺口都还是未知的风险。那两位研究者就此做了新的计算机模拟,得出霰弹枪测序法完全可行的结论。这个结论遭到会议上专家异口同声的反驳。他们进一步研究的资助申请也随即被拒绝。

当时也在座的文特尔没有发表意见。


两年多后的1998年5月8日,因各自工作都频繁出差开会的文特尔和柯林斯在一个机场的休息室中不期而遇。寒暄之余,文特尔似乎不经意地告知柯林斯,他即将离开自己的非营利机构,准备组建一个新公司全力投入人类基因组的测序。乍听之下,柯林斯不禁目瞪口呆。

两天后,影响巨大的《纽约时报》在头版披露这一重大新闻,冠之以“科学家的计划:在三年内为全部DNA测序”的醒目标题。这篇报道开宗明义地强调这是一位科学家和一家私营公司挑战政府以30亿美元支持的庞大项目之壮举。那时候,官方的人类基因组计划已经正式运行八年,还只刚刚测得区区3%的人类基因。他们预计整个人类基因组测序将在2005年完成,比文特尔的“三年内”要迟一倍多的时间。而文特尔声称他的测序会比人类基因组计划便宜得多。《纽约时报》因而尖锐地指出:文特尔如若成功,已经消耗纳税人19亿美元的官方测序项目将惨遭超越而沦为多余。

三个月后,文特尔果然注册成立“塞莱拉基因组”公司。这个名字取自拉丁语的“快速”。为了强调时不我待的迫切,文特尔为公司制定口号:“速度最重要,发现等不及”¹⁰

那个“等不及”的确是文特尔的人生写照。他当初放弃国立卫生研究院的铁饭碗投身私营企业,正是他等不及那里四平八稳的缓慢科研节奏。在这个1998年,他又一次等不及了。那是因为新一代的自动测序机已经问世,测序速度可以达到已有型号的八倍。时刻关注技术进展的文特尔敏锐地察觉这又是一个机遇。在这款每天能测出多达100万碱基对的拿手武器上运用霰弹枪测序法,他应该能将完成人类基因组30亿碱基对测序的时间大为缩短。因此,他果断离开已经驾轻就熟的非营利结构,与测序机的发明人和销售商一起创办塞莱拉公司,向人类基因组发起最后的总攻。

当然,文特尔看到的不只是即将来临的科学突破。抢在官方人类基因组计划之前完成人类基因的测序也是一个无比诱人的商机。尽管他也曾对百慕大原则表示首肯,作为私营企业的塞莱拉公司却并不准备遵循那几项原则。塞莱拉测定的碱基序列不会在24小时内公诸于众。文特尔只许诺每三个月公布一次,为塞莱拉及其付费客户们留下足够先睹为快、在应用上先行一步的机会。同时,塞莱拉也计划为其中约1%的重要基因申请专利,更进一步背离提倡无偿共享的百慕大原则。


与文特尔在机场分手后,柯林斯也被动地进入“等不及”状态。仅仅几天后,他在冷泉港实验室召集紧急会议,邀请人类基因组计划的几百名属下共商对策。这次会议距离乐观的百慕大会议不过两年多,同样地在风景秀丽海滨共聚一堂的科学家们的心情已经迥然相异。他们还无法相信文特尔要在三年内完成人类基因组测序的大话。毕竟那个霰弹枪测序法能否应用于如此庞大复杂的基因组仍未有定论。新的测序机器也还没有经受过实际应用的考验。但他们也不再敢继续轻视已经多次出奇制胜的文特尔。在冷泉港作为东道主的沃森甚至将文特尔最新的挑衅比作当年希特勒悍然武力吞并波兰。那是第二次世界大战在欧洲爆发的标志。

英国的惠康基金会率先应战。他们在会上宣布即刻将资助桑格中心的金额加倍,大力提升桑格中心的测序能力。主任苏尔斯顿如虎添翼。有了这样强有力的后盾,桑格中心完全可以实现完成人类基因组三分之一测序的雄心。

另外三分之二的基因测序则主要依靠美国的各个测序中心。柯林斯发觉形势非常不乐观。这些遍布各地的大学实验室良莠不齐,只有两个中心成功地将测序代价降到一美元一个碱基对以下。其它实验室落后甚多,有的甚至还需要10美元测定一个碱基对。它们显然无法与文特尔的高效率运作抗衡。等不及了的柯林斯不得不大刀阔斧地改革这个庞大的官僚体制。他毅然决然地砍掉十几所大学的绝大多数,集中财力只资助其中条件最好的三所,让他们也能像文特尔的公司一样装备上标价达30万美元一台的新型自动测序机器。这样,那三所大学的测序中心加上隶属能源部的研究所和英国的桑格中心构成人类基因组计划最后决战的主力部队。

柯林斯深知,假如单枪匹马的文特尔果真获胜,将已经耗资巨大的官方人类基因组计划置于无用之地,这无论对将来的大科学项目还是当前的政治博弈都会产生巨大的负面影响。他个人也势必难辞其咎。为了对纳税人有所交代,柯林斯不得不审时度势,改变他们的测序战略。

自人类基因组计划萌芽以来,从沃森到柯林斯的主流分子生物学家反复强调完整测序的重要性,曾经对文特尔各种投机取巧的手法极尽冷嘲热讽之能事。在他们心目中,一“字”不漏地测出人类DNA的全部30亿来个“字母”是人类基因组计划不可动摇的使命。文特尔的捷径无法保证最后所得的碱基序列中不会留有空隙,因而不能被接受。尽管文特尔一再坚持霰弹枪测序法足以涵盖99%的碱基序列,最终的空隙实在微不足道。在新的压力下,柯林斯不再能坚守他们自己的底线。他提议人类基因组计划也不再盲目地追求获取完美的基因组序列。首要任务应该是尽快得到一份粗糙、其中会含有错误和遗漏的基因组“工作草图”¹¹。柯林斯估计,如果允许结果中存在少于10%的错漏,他们有希望在2001年底完成这个工作草图。那正是文特尔已经宣布的“三年后”。

这是一个几乎根本性改变人类基因组计划宗旨的提议,顿时遭到柯林斯麾下科学家的强烈反弹。但终究形势比人强,他们还是在那年九月通过了“工作草图”的新策略。面对文特尔的咄咄逼人,他们别无选择。

短短的四个月内,原本井井有条的人类基因组计划几近天翻地覆。山雨欲来风满楼的局势也引起科学媒体的极大兴趣。他们不约而同地把即将全面展开的人类基因组测序称作一场赛跑。一方是跨越大西洋的庞大政府团队,宛如正规军。另一方则是特立独行的文特尔率领的游击队。双方剑拔弩张,怀着不同的动机奔向同一个目标:夺取最早揭开人类编码的桂冠。

这将是一场空前绝后的科技竞赛。

(待续)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多