分享

基因宇宙(上)

2022-05-20  fuhaizhenren

图片

 书名:基因宇宙
作者:埃德文·柯克
献给我挚爱的父母—罗宾·恩菲尔德·柯克与罗莎莉·萨克斯比,
感谢他们给予我生命及对我的抚育之恩。
 
写在前面
本书讲述了很多我接诊过的病人的故事。为保护患者隐私,我对这些内容进行了大幅调整,有时会将多个病人的故事整合在一起。书中所有的故事都真实发生过,我这么做只是希望这些内容不具有任何针对性。有一种情况除外,如果某个病人的故事已在相关医学文献中刊载过,通常我会保留该版本中的关键信息。此外,有些故事的主人公,如杰西·基辛格(Jesse Gelsinger)和麦肯齐·卡塞拉(Mackenzie Casella),并不是我的病人,但关于他们的故事,已有详尽的报道。麦肯齐的父母也读过并同意我在本书第十一章中讲述他们女儿的故事。

序言

 
凡是过往,皆为序章
 
遗传学带我游览了一些意想不到的地方:有堆满数百箱老鼠的地下室;位于巴基斯坦及悉尼市郊的清真寺;还有成百上千人会聚一堂的舞厅,当时每个人面前都摆着两小杯“毒药”。
不过,通常情况下遗传学家的日常在外行看来也并没有什么特别之处。我们的生活充斥着各种会议和文书工作。和其他医生一样,我们会在诊室里坐诊,不时也会查房。我们的实验室里除了高科技检验设备,就是再普通不过的办公空间,而那些所谓的高科技检验设备也并不起眼。也许偶尔会有那么一两台具有未来感的设备,但我们使用的大多数设备都不过是传统的“四四方方、平平无奇的灰色物件”罢了。
然而,你千万不要被这些表象迷惑。如今,遗传学领域正发生着许多令人瞩目的变化,一场革命悄然兴起,已颠覆了医学的某些领域,并正在向其他领域延伸。相信用不了几年,基因组测序就会变成一项日常操作。也就是说,如果你还没尝试过,机会很可能马上就要来了。再过十年二十年,你的家庭医生会掌握你的遗传信息,它将同你的血压、体重及用药记录一样,构成健康档案的一部分。
“你认为十年后自己在做什么?”这是一道典型的职场面试题。如果这个问题的对象是一位临床遗传学家,答案往往是:十年之后,这个专业将逐渐消亡。究其原因,并不是遗传学将变得不那么重要,恰恰是因为它太重要了。未来几乎所有的医生都要精通遗传学知识,只懂遗传学的医生将无用武之地。这样的预言我已听了近四分之一个世纪,时至今日似乎变得有些遥不可及。事实上,真正开始接触遗传学的专科医生少之又少,其中主要是神经科医生,也有一些心脏病学家、内分泌学家等。医学的进步如此之快,大多数医生专攻各自的领域都已焦头烂额,根本无暇顾及遗传学领域的相关动态。此外,尽管我们的群体已日渐壮大,但毕竟基数很小,所以我们遗传学家还不怎么为人所知。很多时候,其他专科医生也搞不清楚遗传学家是做什么的。
我们到底做什么呢?不同于一般的专科医生,我们的病人并不局限于某个年龄段,我们看的病也不局限于某个器官。有时,我们要在新生命孕育之前就提前干预;有时,我们的病人是尚未出世的胎儿。婴儿、儿童和备孕的成年人都可能是我们接诊的对象。此外,来找我们看病的还有孩子的祖父母,他们或是在晚年患上某种遗传病,或是为了通过基因检测查明是否携带了某个家族致病基因。有时候,一个人的第一次基因检测在他去世后才完成。正如我的同事大卫·莫瓦特(David Mowat)所说,我们不仅要像全科医师那样守护“从子宫到坟墓”的生命之旅,还要守护“从精子到蠕虫”的整个基因宇宙。
将我们的病人联系在一起的当然是基因,尤其是遗传性疾病。我们要解答的往往是最基本的问题。例如:我们怎样才能孕育一个健康的孩子?是什么导致了我孩子的心脏病?我会不会像我的父亲和爷爷那样患上亨廷顿病(Huntington disease, HD)?
人们问起这种问题的时候,实则也是让我们走进他们的人生。这往往是他们一生中最为难熬的时光,充满了失落与悲伤。与遗传学打交道的这些年里,我有幸走进了成千上万人的人生。对我来说很幸运的一点,也正是在这段时期,我们对遗传学的认识实现了空前飞跃,探索基因宇宙的脚步日渐加快。
我与遗传学的缘分要从20世纪90年代中期说起。那时我还是一名初级医生,在悉尼一家儿童医院的重症监护室工作。我的一个病人是患有先天性心脏病的婴儿。她长得格外瘦小,而且似乎不愿意自主呼吸,必须依赖机器维持生命。
终于,基因检测结果出来了,院里马上召集了会议,会上将由一位临床遗传学家向孩子的父母交代病情。这样的会议通常也需要重症监护室的医生出席,而那天我碰巧在场。那是那对年轻的父母此生最黑暗的一天。
那位临床遗传学家就是安妮·特纳(Anne Turner)博士。之后,她成了我的同事,也是我最好的朋友之一。安妮聪慧、善良、忠诚,酷爱旅行,热爱生活。她是位和善的母亲,如今也是位慈爱的祖母。那时,我只知道她是我的前辈,在一个小众而又有些神秘的医学领域,她是受人崇敬的专家。
与我不同,安妮对我们的第一次见面并没有什么特别的印象,毕竟当时她的注意力都集中在自己艰巨的任务上。她要告诉那对年轻的父母,他们的女儿就要离开他们了。
基因检测结果显示,小女孩儿体内多了一条13号染色体。这是一种叫帕陶综合征(Patau syndrome)的先天性染色体异常,患儿通常体形很小,并常伴有心脏病、脑畸形或其他发育缺陷。他们的大脑无法正常运作,甚至不能维持正常的呼吸。几乎所有帕陶综合征患儿都活不过一岁,而他们中的大多数会在出生后的几周,甚至几天内夭折。即使有极少数患儿能够幸存下来,他们也会患有严重的智力缺陷及其他健康问题。
这一诊断解释了我们力图治疗的所有症状,特别是对一个无法自主呼吸的孩子来说,这意味着前途艰难万险。
告知坏消息很难。父母听到关于他们孩子的坏消息时的那种震惊与悲恸无以言表。在场的每一个人看在眼里,疼在心里。传达这一消息的人无疑要承受巨大的压力,部分原因是你总会有一种难以摆脱的“负罪感”,觉得痛苦是自己造成的。有时候,经过一段时间的相处,你已经了解并喜欢上了你要“伤害”的那个人,但即使面对一个刚刚认识的人,传达这样的消息又谈何容易。
那么,彼时彼刻目睹了这一切的我,为何没有对遗传学敬而远之,反而心生向往呢?在我看来,主要是安妮的处事方式感染了我。她的温柔体贴让一切来得没有那么直截了当。她先解释了什么是染色体,多一条染色体会怎样,紧接着又具体说明了对那个小女孩而言这意味着什么。孩子的一位家长问能不能去除那条多余的13号染色体,治好孩子的病。安妮耐心地解释说,自怀孕时起,这个问题就已存在于这个孩子体内的每一个细胞中,因而无法改变。她懂得何时倾听,何时表达自己的想法。她理解这对夫妇对女儿的爱,也能体会他们此时的痛,但她并没有给他们虚假的希望。当最先进的科学与最深刻的人性碰撞,医者该何去何从?那天,安妮为我上了生动的一课。
 
我写这本书的目的,就是想通过分享那些命运与遗传学息息相关的人的故事,传递人类遗传学中的人性之光。如果你是为了科学而来,请接着读下去—遗传学是迄今为止最富魅力的现代科学,而你可以在本书中收获大量的科学知识。
人类遗传学的故事,首先是关于人的故事,是基因宇宙统治下的人生百态和百态人生。这样的故事映照着你我,但有一些人的故事比较特别,基因对他们的影响要强大甚至残酷得多。它是那个命运自孕育时起就被宣判的婴儿的故事,也是那位透过实验室的显微镜解读小女孩生命密码的科学家的故事。它是安妮的故事,也是我的故事,同样是那些第一次知道什么是染色体及其与疾病关系的人的故事。
也许最重要的是,它是两位年轻父母的故事,痛失幼女使他们悲痛欲绝,但有了对基因宇宙的了解与认识,他们又能够鼓起勇气面对未来。
 

第一章  比你想的简单

柯克教授让遗传学像ACGT一样简单。
—谢默斯·柯克
 
 
我的朋友兼同事史蒂夫·威瑟斯(Steve Withers)也是一位遗传学家,他经常说别人的大脑“有一颗行星那么大”。很多人觉得研究遗传学令人头大,它似乎总给人一种高深莫测的感觉,但事实证明这完全是假象。遗传学其实非常简单,如果你能够在高中毕业之前轻松驾驭小学数学,那么掌握遗传学的要领也不在话下。
为什么人们会觉得遗传学很难呢?也许只是因为它包含了大量的细节。遗传病有成千上万种,它们的严重程度各不相同,很多病症之间还会相互交叠。要想充分认识遗传疾病,了解细胞的工作机制必不可少,而其中又包含了海量的信息。不过,这都是信息的叠加罢了,其中的每一部分理解起来都很容易。
要证明这点不难。遗传学中最重要的信息,也许莫过于DNA与蛋白质的关系。这种关系和字母与单词的关系类似,但要简单得多。论据如下:
人体内的很多物质都由蛋白质构成。蛋白质是构成人体细胞的基本物质,也是细胞间质的组成成分。人体的任何生命活动都离不开蛋白质的参与。打个比方,假如你体内的细胞想要造一辆汽车,它需要的每一个机械配件和电子零部件都是由蛋白质构成的,而且不仅仅是这些零件,连你用于停放汽车的车库也是如此。蛋白质本身则是由氨基酸组成的。
脱氧核糖核酸(DNA)是一种携带遗传信息的化学物质。这些信息用只有四个字母的字母表记录,即A、C、G、T。它们分别代表腺嘌呤(adenine)、胞嘧啶(cytosine)、鸟嘌呤(guanine)和胸腺嘧啶(thymine)四种碱基(nucleobases),是DNA的化学组成部分。
与英语不同,DNA的语言只有21个单词。它们的拼写通常包含3个碱基—这是一种三联体密码。在英文中,“CAT”是一种毛茸茸的宠物,但在DNA语言中,它代表的是一种叫组氨酸(histidine)的氨基酸。这套语言中一共有20种氨基酸,而第21个单词是“终止”。基因是编码特定蛋白质的一段DNA序列。也就是说,它是一串三联体密码,表示“先是一个组氨酸”,“再加一个甘氨酸(glycine)”,然后“再来一个脯氨酸(proline)”:“好了,停!”
你可以把碱基看作字母,氨基酸的名字就是它们拼成的单词,基因则是最终连成的句子。每个句子都说明了如何合成某个特定蛋白质,而每个DNA分子中都包含了很多这样的句子。可以说,这是一本《人体建造指南》。
遗传学的基本原理,仅此而已。这比学习阅读简单得多,6岁的孩子就能轻松掌握。更好的一点是,你不需要真正去学习这门语言—你只需要知道它有一套既定的法则,理解其中的原理就足够了。我研究了20多年遗传学,只知道三四个密码子的拼写,其他的我会在需要时查找。
读到这儿,即使之前从未接触过遗传学,你现在也已经掌握了遗传学中最为复杂的概念。除此之外,都是一些细枝末节。
幸运的是,遗传学不仅简单,而且特别有趣。染色体(chromosome)就是个很好的例子。
染色体是DNA在我们细胞内的存在形式,其构造十分特别。
学习遗传学有一大鲜为人知的好处,那就是你有机会亲自制备和检验自己的染色体。谁能放过这样的机会呢?但今天的医学生没有这样的机会,因为他们害怕自己会发现一些不想知道的东西。这可真是个遗憾,要知道透过显微镜近距离地观察自己的基因组很有满足感。我想这种感觉或许有点像动完手术后通过手术视频察看自己的心脏,只不过省去了开膛的麻烦罢了。
基因组是生物体所有遗传物质的总和,任何有生命的个体都有自己的基因组,包括你、我、鼻涕虫、你午餐吃的沙拉里的甘蓝,甚至餐厅服务员指甲里的微生物。此外,细菌、原生动物和真菌都有各自的基因组,病毒也不例外。从细菌到一切比细菌更为复杂的生物体,基因组都以染色体的形式存在。不同物种的染色体数量差异很大,而生物体的复杂程度与其染色体的数量之间并没有明显的关联。关于细菌,我可以肯定地说,它们只有一两条聚集在一起的环状染色体。雄性杰克跳蚁的结构比细菌复杂得多,但同样也只有一条染色体,而大西洋多眼灰蝶竟有450条染色体。
如果细胞正处于分裂中期,染色体集中排列在赤道板上,形态结构稳定,数目清晰,观察起来最为容易。人类(大多数情况下)有23对染色体。更具体一点,它们是46条存在于你体内数以万亿计的细胞中、总长约2米的细长DNA链。2米听起来也许不算长,但你可别忘了,储存了几乎所有细胞DNA的细胞核,它的直径只有六百万分之一米。如果说细胞核和你家客厅一样大,而DNA是由绳子组成的,那么你的客厅里就会有根长达1 000千米的绳子—足够从伦敦延伸至柏林,或者从旧金山延伸到波特兰。
大多数时候,这根“绳子”并不会紧密地捆绑在一起。它是一根纤细的游丝,在细胞核中延展和盘绕。它不是完全松散的,而是缠绕在一种被称为组蛋白(histone)的蛋白质周围。这种DNA与蛋白质的结合体被称为染色质(chromatin),它是破解生命奥秘的钥匙。
众所周知,DNA是信息的载体。这些信息代代相传,穿越漫长的时光。你的DNA不是一朝一夕形成的,而是一长串事件共同作用的结果,这一过程跨越了数十亿年,从来不曾中断。其间,它被复制了一遍又一遍,一些微妙的变化也在悄然发生。这个故事要从某片我们遗忘已久的海洋说起,那片温暖的浅海孕育了最原始的生命。自那时起,你的DNA开始了漫长的演化之旅。从哺乳动物到原始人,再从整个人类的存在直到你的出现,这一路走来的记忆都铭刻在了你的DNA里。我们的大脑也许会遗忘,但我们的基因不会。
与遗传学打了一段时间的交道后,我发现每条染色体都有自己的“性格”。与其说这是一种个性,不如说这是有人提起某条染色体时我的脑海里马上闪现的东西。1号染色体靠近顶部的部分有一块灰白色的区域。如果在受孕时将其中一条染色体上的这个区域去掉,那么这个孩子就会有智力障碍并伴有独特的面部特征,如深陷的眼睛和低垂的耳朵。7号染色体上有导致囊性纤维化的基因位点,当时为了找到这个基因,还掀起了一场国际竞赛(这场角逐的最终赢家是当时在多伦多工作的加拿大籍华裔人类遗传学家徐立之)。乳腺癌1号基因(BRCA1)是一种与遗传性乳腺癌直接相关的基因,它位于第17号染色体上。寻找这个基因的竞争更加白热化,直到今天,这场争夺战的余烟仍未消散,专利权之争仍在上演,对人们的生活也产生了深远影响。15号染色体与普拉德-威利综合征(Prader-Willi syndrome, PWS)和天使综合征(Angelman syndrome)有关,这两种遗传病看似截然不同却又总是“难舍难分”。在人类基因组中存在一些“印记区”,这些区域的基因就像拥有记忆一般,会根据自己亲代的不同(父源或者母源)进行相应的表达。15号染色体上就有一块这样的区域。第13、14、15、21及22号染色体都是近端着丝粒染色体(acrocentric chromosomes):它们的短臂极短,“腰部”都快到了本来“头部”所在的位置。有时,两条这样的染色体还会融合在一起,即所谓的罗伯逊易位(Robertsonian translocation)。相较之下,Y染色体宛如一片荒原,放眼望去,遍地都是破碎基因的遗骸,了无生机。它几乎没有任何存在的理由,但仍在挣扎。
染色体分析(chromosome analysis),又称染色体核型分析(karyotyp-
ing),是最早的基因检测。尽管在此之前已有其他一些可用于检验遗传疾病的医学测试,如可以诊断镰状细胞病(sickle cell disease)的血涂片检查等,但染色体核型分析才是真正意义上的基因检测。不仅如此,它是第一种也是很长一段时间内唯一一种基因组检测:它可以一次性完成一个人全部基因组的检查。其结果就相当于一幅鸟瞰图,用今天的标准来衡量可能不够详细,但不论如何,这一检测手段经受住了时间的考验,沿用至今。
面对一项全新的技术,我们人类究竟如何迅速积累经验呢?我对此充满了好奇。飞行就是个很好的例子。人类历史上第一架动力飞机诞生后不久,航空业就已摸索出一套自己的法则。例如,“飞行、定向、沟通”(aviate, navigate, communicate),“世上有'老’飞行员,也有'勇敢’的飞行员,却没有'勇敢的老飞行员’”,“对飞行员而言,没有什么比你上方的高度和你身后的跑道更没用”。
同样的故事也在细胞遗传学(染色体研究)领域上演,哪怕其他更新的基因技术亦是如此。年轻一代总能够“坐享其成”,毕竟我们一直以来都这么做(既然行得通,何必改变它呢)。而今,遗传学这一年轻的领域,也有了自己的传统。
说到传统,就不得不提起染色体各部分的命名。仔细观察染色体,你会发现有些染色体中间有一个像“腰”一样的部位。这是着丝粒(centromere),作用是在细胞分裂中固定染色体并引导其行为。着丝粒永远不会在染色体的正中间,也就是说它的两侧分别是短臂和长臂,被称作p臂和q臂。
为什么是p和q呢?这要从1966年的一场会议说起。那时,染色体核型分析还处在起步阶段。第三届国际人类遗传学大会在芝加哥召开,旨在探讨人类染色体标准化命名的相关事宜。会上讨论决定将染色体的短臂命名为“p臂”—取自法语的“petit”一词,意思是“小的”。还曾有人讨论过用“s”来命名,灵感源自英语中的“short”(短的)。很显然法国细胞遗传学家杰罗姆·勒琼是位有话语权的人。当然,这也可能是那些想要以自己的方式命名长臂的人做出的“战术让步”。
当以“p”来命名短臂的决定最终通过的时候,已是深夜时分。来自英语国家的参会专家们一再呼吁用字母“l”命名长臂,但又有人指出这很容易与阿拉伯数字“1”混淆。没有人想让法国人“独占”两条染色体臂,讨论一度陷入了僵局。打破这一僵局的是英国遗传学家莱昂内尔·彭罗斯(Lionel Penrose)。他提议用字母“q”来命名,一来这样不会偏袒任何语言,二来在遗传学的另一分支—群体遗传学(population genetics)中有一个著名的等式,即p+q=1。用在这里,则可以理解为:P臂和q臂构成一条完整的染色体。会议开到这个时候,每个人好像都已疲于争辩,都希望赶紧结束讨论回去休息。于是,“q臂”就这样诞生了。
通过观察染色体臂,细胞遗传学家掌握了利用显带技术识别染色体的方法。其原理是制备染色体载玻片时使用的染料会使染色体的特定部位呈现出深浅不一的带纹,即染色体的“带”。我们已经了解了1号染色体的顶部(p臂的末端)有什么特点,这里我再补充一点:1号染色体也是人体内最大的染色体。凭借这两点,你以后一定可以轻松地找到它。现在,我们看看7号染色体,它大小适中,在靠近其p臂末端的位置有一条明显的暗带。这样,你就肯定不会把它和1号染色体弄混了,就算在一堆染色体里你也应该能够把它们找出来。那么恭喜你!成为一名细胞遗传学家指日可待。
进行核型分析时,22对常染色体按照大小递减的顺序被标记为第1至22号染色体(尽管21号染色体实际上比22号染色体小一点),性染色体则用X和Y表示。此外,还可以根据带型对染色体进行分类,而这些带型也有极为细致的划分方式,人类细胞遗传学命名体系就这样形成了。例如:1号染色体可以被划分为1p和1q,而1p又进一步细分为1p1、1p2、1p3……到今天,我们已经有了诸如1p36.33的命名—从左至右分别代表染色体编号、臂号、区(3)、带(6)、亚带(3)及次亚带(3)。识别这些特定区域不仅对仪器设备的分辨率有极高的要求,也愈来愈考验遗传学工作者的技术水平。在我刚开始接触遗传学的时候,诊断遗传病的主要手段之一便是观察。一名经验丰富的科学家能够借助显微镜观察到任何细微的变化,不管是有东西缺失、增加,还是位置发生改变,都逃不过他的法眼。这是优秀的细胞遗传学家才拥有的火眼金睛,只有你想不到的,没有他找不到的。
当我自己尝试的时候,我甚至难以将染色体区分开来,因为它们并不是成对整齐排列在细胞中的。相反,它们杂乱无章地堆在载玻片上,还经常相互交叠。要想成为一名技艺娴熟的细胞遗传学家,至少需要花一年的时间在专人指导下练习观察染色体;要成为一名真正的专家,还要花上数年的时间。然而终有一天,也许就在不远的将来,新技术的出现会让我们这个职业及我们掌握的这些技能失去存在的价值。
染色体的数量对一个人而言至关重要,过多或者过少都可能带来严重的后果。除了Y染色体,最小的当数21号染色体,它的基因数量也最少。即便如此,如果体内有三条而非两条21号染色体,就会导致唐氏综合征(Down syndrome),这种复杂的遗传病会对身体各个系统造成严重影响。此外,少一条21号染色体也是致命的,这样的胎儿甚至活不过孕早期。这种由整条基因异常导致的遗传病还有很多。例如,爱德华兹综合征(Edwards syndrome)就是因为患者体内多了一条18号染色体。至于多了一条13号染色体会怎样,读过前文那个小女孩儿的故事,相信你已经有答案了。
早期的细胞研究发现,蝗虫有巨大的生殖细胞(即最终分化为精子或卵子的细胞),而且它们体内的染色体也很大。在那个显微镜分辨率很低且使用不便的年代,蝗虫无疑是最好的研究对象。到20世纪初,科学家们已经发现了染色体和遗传之间存在某种联系。这本是个很好的开端,但一晃数十年过去了,人们才第一次证实基因与人类疾病有关。在20世纪的大部分时间里,我们甚至都不知道人类到底有多少条染色体。那时,人们一度认为答案是48条而非46条,所有人也都信以为真。
青霉素的发现堪称人类医药史上“最美丽的意外”,谁也不会想到这种拯救了无数生命的良药最初竟源自实验室里的一个失误。这个故事的主人公是亚历山大·弗莱明爵士,那时已经是一个著名研究员的他正在研究金黄色葡萄球菌(staphylococcus aureus)。1928年9月的一天,外出度假归来的弗莱明发现,自己放在实验室(出了名的杂乱不堪)里的一只细菌培养皿被霉菌污染了,而在这些霉菌周围似乎形成了一个“禁区”,让原本生长旺盛的金黄色葡萄球菌不敢越雷池一步。之后,弗莱明在研究青霉素的特性方面取得了一些进展,包括尝试分离提取青霉素、开发抗菌药物等。反复尝试过后,他最终得出的结论是这可能行不通,于是放弃了这项研究。真正让青霉素从实验室走向临床,成为救命良药的另有其人:当时一同在牛津大学工作的霍华德·弗洛里和恩斯特·柴恩是最主要的功臣。尽管在1945年,他们二人与弗莱明一起分享了诺贝尔生理学或医学奖的殊荣,他们的名字却远没有弗莱明广为人知。
读到这里你可能会想,如果当初意外发现青霉素的不是弗莱明,而是弗洛里和柴恩,这个故事的结局会不会有所不同?纵观人类科学发展史,你会发现一个奇怪的现象,很多人做出了开创性的贡献,却湮没在历史的尘埃中。徐道觉就是这样一位无名先驱。像弗莱明发现青霉素一样,他发现低渗溶液预处理的染色体制备方法也是一个“美丽的意外”。不同于弗莱明,他并没有止步于此,最终成功地让自己的这一发现走出了实验室,写下了人类细胞遗传学的新篇章。弗莱明的名字家喻户晓,徐道觉的名字却鲜为人知。
这确实是一个遗憾。徐先生是一位高风亮节的君子,也是一位伟大的先驱者。倘若他的名字和他的贡献一样为人们所知,他现在应该至少是一部传记片的主角了。美国细胞遗传学会议的网站名起得非常绝妙:chromophile.org,但比起这个名字,更为醒目的还是“人物风采”那页上徐先生的照片。那张照片拍摄于2000年,照片里的徐老紧握着美国细胞遗传学会议颁发的首个杰出细胞遗传学家奖的奖杯,看起来就像一位和蔼可亲的老爷爷。将时钟拨回半个世纪以前,那时的他还是一个极具冒险精神的年轻人。20世纪50年代初,中国还不是现在的模样,徐先生离开了自己的祖国,远渡重洋前往美国得克萨斯大学奥斯汀分校进行果蝇研究(即著名的黑腹果蝇,它们虽不受果农欢迎,却是遗传学家们的最爱)。得克萨斯州有很多远近闻名的地标,如休斯敦太空中心、棉花碗球场、阿拉莫遗址等。在一个更加理性的世界,得克萨斯大学奥斯汀分校的果蝇实验室(the Texas Drosophila Laboratory)比它们中的任何一个都更有名。
这一切还要从1956年的一个实验室“小插曲”说起。当时,一名助理在调配用来制备染色体的盐溶液时看错了说明,加了过多的水,在毫不知情的情况下配成低渗(过稀的)溶液。用这种溶液漂洗过的细胞会吸水膨胀,其内的染色体也会分离。这样再进行观察,染色体就不会“纠缠”在一起,辨识起来也更加容易。这一奇特现象引起了徐道觉的注意,他把握住了这个机遇,成功找出了其中的玄机,还找到屡试不爽的盐溶液配比,最终发表了自己的成果。
这一消息一出,蒋有兴(他至少被遗传学家们记住了)和阿尔伯特·莱文(他几乎不为人所知)马上便用这一方法证实人类二倍体细胞的染色体数是46条,而非48条。试想一下,如果你连有多少条染色体都数不清,发现染色体异常根本无从谈起。现在情况变了,就在几年后(1959),一个来自法国的团队(成员包括那个一举拿下染色体“p臂”的勒琼、玛尔特·戈蒂耶和雷蒙德·特平)首次报告了唐氏综合征患儿体内有一条多余的21号染色体。这就像一把钥匙,开启了人类发现其他染色体疾病的大门。更重要的是,细胞遗传学的进步意味着我们能够准确识别单个染色体,进而绘制精确的遗传图谱。可以说,人类基因组计划及现代遗传学的绝大多数成就都要归功于徐道觉实验室里的那个“失误”。
说巧不巧,也是在这一时期,DNA的研究终于有了实质性进展。1953年,沃森和克里克(基于罗莎琳德·富兰克林的实验数据)的论文发表了,首次对DNA的双螺旋结构进行了描述。这是一个具有划时代意义的重大发现,直接推动了本章开头所描述的人类对DNA与蛋白质关系的认识。正是在徐道觉、沃森、克里克以及走在他们之前的无数“开路人”的不懈努力下,遗传学这一崭新的学科冉冉升起了。
 

第二章  DNA晚宴

不过也有一些人能够登上天国,触摸那把开启永恒殿堂的金钥匙。
—约翰·弥尔顿
 
 
看着面前两杯半满的烈酒,我陷入了沉思。它们被精致地码放在一个小巧的木质托盘上,紧挨着我的甜点勺。每个人的桌前都有这样的标配。我的餐前酒还有大半杯:一方面,我并不是很想跳过它直接喝烈酒;另
一方面,此刻空气里弥漫着的欢庆气氛,又让我对这两小杯酒有些心动。
幸好,不论是我,还是其他坐在这个偌大而又拥挤的酒店舞厅里的人,终究还是抵挡住了诱惑。毕竟,在庆祝DNA双螺旋结构发现50周年这样一个极具纪念意义的场合,如果有来宾在晚宴上“中毒”可就不好办了。
这场DNA晚宴是2003年在澳大利亚墨尔本召开的第19届国际遗传学大会的一大亮点。会议的组织者是一群从善如流而又勇敢无畏的人。虽然可能有那么一点危险性,但今晚绝对是令人难忘的一晚。估计你也能猜到,会场肯定少不了各种巨大的螺旋形气球,但有点出人意料的是,这些气球看上去有些特别。虽然不知道是谁,但负责设计它们的人一定是想让这些“双螺旋”看起来“瘦”一点;所以我们最终看到的成品看上去更像“三螺旋”。会上,人类基因组计划的总协调人弗朗西斯·柯林斯拿起了吉他,对着人类基因组演唱《祝你生日快乐》。
紧接着, “毒药”重磅登场了。
平心而论,抛开潜在的危险性不谈,这是个绝妙的主意。其中一个杯子里装着几近完成的某种植物DNA的提取物,另一个杯子里装的则是完成提取所需的最后一种原料。在夜幕刚刚降临的时候(也许就在天黑前的最后一刻),司仪让我们把其中一个杯子里的东西倒进另一个杯子里,然后神奇的一幕上演了,DNA真的分离出来了。今夜我们都为它而来,而此刻它就这么真真切切地呈现在了我们面前。
你在家里也完全可以做这个神奇的实验,用的都是一些再普通不过的原料(其中只有一种带有毒性)。听说烹饪书很畅销,这不,食谱来了:
原料:草莓适量(一般两三颗就够了,主要看草莓的大小),水,食用盐,洗洁精,消毒酒精(异丙醇,没有的话也可以用甲基化酒精代替)。
具体步骤:
1.在半杯温水中加入一小茶匙食用盐,搅拌直至其完全溶解。
2.在盐水中加入两茶匙洗洁精并轻轻搅拌(不要产生泡沫)。
3.把草莓放入装三明治用的密封塑料袋中并将封口封闭,再用手将草莓完全捣碎。
4.把备好的含洗洁精的盐水倒入装有草莓的密封袋中。
5.充分搅拌,但动作务必要轻,避免混合液产生泡沫。
6.用一张咖啡滤纸将混合液过滤至玻璃杯中,杯中液体的量一定不能过少。为了便于后续操作,最好不要选用细长形的杯子。
7.将消毒酒精沿杯壁缓缓地注入杯中,与草莓提取液的比例控制在1∶1左右。此时酒精会悬浮在最上层。
8.杯中的溶液已具有毒性,请勿饮用。
9.现在,你只需要把一切交给时间,静静地等待黏稠的白色絮状物从溶液中析出,那便是你要的DNA。
如果你有兴趣的话,不妨用一根木棍把析出的DNA从玻璃杯里挑出来仔细观察,你会发现它有很多有趣的地方。首先,用木棍挑起絮状的DNA在杯壁上轻拍几下,团块的体积就变小了。这时,再小心翼翼地将它从溶液中提起,你就能得到一根细长的丝状物。DNA具有黏性,可以松散或紧密地盘绕在一起,所以你所看到的团块体积的减小,实际上是处于松散状态的DNA更加紧密地盘绕在了一起。你从溶液中提取出的那根细丝状DNA则是一长串独立的DNA链,只不过从容器里提出来的时候黏在了一起。
你一定要亲手尝试一下。要知道,这种手握生命密码的感觉十分绝妙,虽然它不管看上去还是摸起来都像极了鼻涕。
弗朗西斯·柯林斯无疑是那天DNA晚宴上的焦点,不是因为他的吉他弹唱(虽然确实好听),而是因为他在人类基因组计划中所发挥的引领作用。三年前,也就是2000年的6月26日,时任美国总统克林顿在白宫举行的记者会上郑重宣布,人类基因组计划草图绘制完成,时任英国首相托尼·布莱尔也以卫星视频的形式参会。招待会上,备受瞩目的除了柯林斯和他领导的由国际公共基金资助的人类基因组计划,还有一家名为塞雷拉的私人公司。1998年是国际人类基因组计划启动的第8年,同年,塞雷拉公司成立并宣布其将利用最新技术在3年内完成人类基因组的测序工作,一场人类基因组测序的公私对决就此打响。克雷格·文特尔率领下的塞雷拉与人类基因组计划国际公共团队势均力敌,最终打成了平手—双方同时宣布人类基因组工作草图绘制完成。
一些人可能会说,此时庆祝还为时过早,毕竟这一基因组序列中还有很多的裂口—不少于150 000个,而且还有至少10%的序列缺失。事实上,2003年4月14日,中、美、日、德、法、英6国科学家才联合宣布,人类基因组计划的测序工作全部完成;然而,即使那时的基因组序列仍有许多裂口。到2004年,情况有了很大的改善,但仍有341个裂口亟待填补。时至今日,这项庞大的工程也没有完全完成。
尽管如此,在2000年首次宣布的时候,一份较为完善的工作草图已经诞生了。说句公道话,这也确实符合当时宣布的“人类基因组计划草图绘制完成”。对大多数研究人员来说,这份草图的意义在于,他们可以通过查阅这些数据获取某个他们感兴趣区域的详细信息,并且大多数情况下都能找到答案。那确实是一个激动人心的时刻,但对于我们这些临床一线的医务工作者来说,这份基因序列的意义似乎还不得而知。
那要从2001年末的一天说起,那天,我们部门收到了一份包裹。塞雷拉公司为我们免费寄来了一张存有人类基因组的光盘。我们兴冲冲地拆开包裹,将光盘放入电脑,准备一探究竟。但是,很快我们便放弃了,因为我们根本无法解读这些信息,更不用说将其与我们的病人联系起来了。事实证明,人类基因组数据从产生到普遍应用于遗传病的诊断和临床治疗,耗费了十多年的时间。如今,我每周都要访问无数次由加州大学圣克鲁兹分校创立和维护的基因组数据库(UCSC Genome Browser)。可以说,没有它我就无法工作。
那么,基因组里有什么?我频频浏览加州大学圣克鲁兹分校的数据库又到底是为了找什么呢?
你还记得从草莓里提取出来的白色黏稠物吗?它由四种不同的化学物质组成,分别是腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶,首字母分别是A、C、G、T,它们被统称为“碱基”。碱基大多数时候都以碱基对的形式存在,这是因为DNA通常为双螺旋结构,人类基因组含有约30亿个碱基对。这种双螺旋由两条单链组成,它们互为补充。一条链上的A与另一条链上的T配对,而C则与另一条链上的G配对,所以双螺旋结构是这样的:
 

图片

这两条链的方向是相反的,DNA有特定的转录方向。这一方向与其被复制和翻译以合成蛋白质有关。与“GATTACA”形成互补的链会被细胞解读为“TGTAATC”,而非“CTAATGT”。
让我举一段自己最喜欢的基因组—TBX20基因的一部分,我取得博士学位它功不可没。如果以相同的字距打印在A4纸上(单面打印),你要用781 250张纸才能打印出完整的人类基因组。如果每张纸的厚度是0.1毫米,你需要一沓78米厚的纸,大致相当于悉尼歌剧院和自由女神像的平均高度。当然,如果没有一把关键的钥匙,这就是一大堆毫无意义的字母罢了。一旦掌握了这把钥匙,这沓纸揭示的就是无尽的科学财富。
那么,这把钥匙究竟是什么?基因组里又暗藏了什么玄机?事实证明,破解基因组奥秘的钥匙远远不止一把。其实,我们的DNA诉说着很多故事,关键是你能不能读懂。
正如前一章中所述,我们体内的染色体是成对存在的。这是因为你有一半的遗传信息来自你的母亲,一半来自你的父亲。同理,你也会把一半的遗传信息传给你的每一个孩子。你的1号染色体一条来自母亲,一条来自父亲,其余22对染色体都可以以此类推下去。1号染色体是人类染色体中最大的一条,它含有近2.5亿个碱基对,其上的基因数超过2 000个。最小的是21号染色体,含有不到5 000万个碱基对,只有几百个基因。不起眼的Y染色体比21号染色体长一点,但只有约50个基因。
在我们的细胞核外其实还有一些DNA,这便是我们的第二基因组,一个很小的基因组(它仅由16 569个碱基对组成,共包含37个基因)。它存在于一种叫线粒体的结构中,这一点之后会详细介绍。
基因这个概念你一定不陌生,毕竟基因组中最有名的就要数基因了。正如我之前解释的那样,基因的作用就相当于一张蓝图,告诉细胞如何合成蛋白质。你体内的一切生命活动都离不开这些蛋白质的参与。在人类基因组中,这种指导蛋白质合成的基因只占约1%—2%。
剩余的基因中到底有多少真正发挥作用,目前众说纷纭。其中一些非编码DNA肯定是有用的,而且扮演着重要的角色,着丝粒就是个很好的例子。它位于染色体的腰部,在细胞分裂中发挥着指导染色体运动的重要作用。正是由于着丝粒的存在,染色体才能够正常分离并均匀分配到两个子细胞中。如果这一环节出错,后果将不堪设想。在染色体的末端还有一种叫端粒(telomere)的结构,相当于给染色体戴上了“保护帽”。你应该听过伯纳德·布雷斯劳的那首关于脚的歌《你需要双脚》,其中有句歌词是:
  你需要双脚穿上袜子
  以保护它们不被磨破
染色体当然不会穿袜子,但就像你的双脚一样,它们的“脚”也怕磨。随着年龄的增长,你体内染色体的端粒本身也会有一些“磨损”,会随着细胞分裂次数的增加而逐渐变短。很多癌症都会伴随端粒的明显缩短,有时端粒甚至会完全消失,使得染色体的末端裸露在外,极易受到损伤。令人费解的是接下来发生的事:细胞发生癌变的过程中,它们染色体的端粒会“重获新生”。这是癌细胞得以“永生”的一部分原因。
虽然编码蛋白质的基因只占人类基因组的1%—2%,但人类基因组约四分之一的区域都有基因分布。造成这种差异的原因是,大多数基因都是由两种序列组成的,即内含子(intron)和外显子(exon)。外显子能够编码蛋白质,也就是说它们的序列决定了蛋白质中包含何种氨基酸,以及何时开始和停止。相比之下,内含子不编码任何东西。它们发挥着某种作用,这点毫无疑问,只是我们目前还不得而知。内含子的体积可能非常庞大,包含成千上万个碱基对。有时候,一个基因的内含子大得足以装得下一个在另一条DNA链上的基因。
你可以在TBX20基因上找到外显子和内含子。你甚至可以在DNA序列中看到一些基因组的“操作指令”。每一个内含子都以G、T两个碱基开头,以A、G两个碱基结尾。于是,G、T和A、G共同构成传递给细胞的一大关键信息,即“这里有一个内含子……好了,不需要蛋白质了—请停下来”。
人类基因组中有多少基因真正发挥作用?关于这个问题,我们还没有找到答案。2012年9月,继人类基因组计划之后的又一重大跨国基因组学研究项目—DNA元素百科全书(the ENCODE project)的阶段性研究成果被整理成了30篇论文,同时发表于《自然》(Nature)等学术期刊。让30篇文章同时发表非同小可,这需要多少科学家的通力合作才能完成,光这一点就已经是一个很了不起的成就了,完全不亚于论文内容本身。ENCODE项目研究团队认为,80%的人类基因组具有某种确定功能。其中最主要的据称是控制其他部分的功能—对细胞生物学的一种颇具官僚主义气息的解读。该消息一出,当时便招致了很多批评,这么多年过去了,争论还在继续。最近发表的一篇论文则认为,只有8%的基因组有功能。这两项研究得出的结论可谓天壤之别。我虽然不知道正确答案,但我觉得这一比例应该不会低至8%,也不会高达80%。
有很大一部分基因组看起来就像基因残骸一般—都是一些经过漫长进化而失去功能的基因及其他成分。例如:我们的基因组中有很多破损的嗅觉受体基因,它们不能发挥任何作用。这是因为在进化初期,我们的祖先需要敏锐的嗅觉才能生存下去,但很长一段时间以来,我们依靠相对不那么敏锐的嗅觉也过得很好。即使这些基因发生了突变,对我们也没有什么影响,破损的基因也就这么遗传给了下一代。你从你父母那里继承了数百个破损的基因,而你又会将它们传递下去,或者说已经传递下去了。尽管这些基因是由破损的基因“原封不动”地复制来的,它们依旧不会产生任何影响。
人类基因中还有很多重复序列,似乎也没有多大作用。有时候,病毒会通过复制将自己的DNA整合到宿主DNA中,这就使得宿主基因组中散布着大量看起来像旧病毒的序列。还有一种情况是DNA片段在所谓的复制事件中复制。想象一下,假如你有多余的某个基因拷贝,那么即使其中一个丧失了功能也无伤大雅。所以在你的基因组中,一个基因往往有两个版本,一个具备正常功能、一个失去功能,后者也就是所谓的假基因。还有一些DNA片段似乎单纯是DNA自我复制的产物,仅此而已。毕竟这些长长的序列看起来毫无特别之处(如ATATATATATATATATAT……)。
总的来说,到底基因组有多大部分能够发挥作用似乎对我们没有什么影响。一方面,现阶段的人类基因组完全够用,足以满足我们的生活需求;另一方面,即使有任何问题,相信都可以通过DNA自我复制的能力和各种引入新DNA片段的机制来解决。很多生物的基因组比我们大得多,好吃懒做、无所事事的DNA自然也多得多,但它们不是照样活得好好的吗?无恒变形虫的基因组据称比我们人类基因组的200倍还要大。看上去毫不起眼的洋葱的基因组也有我们的5倍大。你还是可以轻松吃掉它(或者提取它的DNA),而不是反过来。河豚的基因组只有人类的八分之一,却比洋葱复杂得多。
看起来,拥有过大的基因组确实要付出代价,起码在艰苦的条件下是如此。有一种叫墨西哥野玉米的植物据称是“玉米的祖先”。2017年,曾有一篇论文对生长在不同海拔的几种墨西哥野玉米的基因组进行了对比。虽然拥有巨大基因组的植物很多,但至少对于墨西哥野玉米而言,所处的海拔越高,基因组就越小。换言之,如果你生活在高山上,周边的环境也十分恶劣,你根本不可能把精力浪费在复制无用的DNA上。
从这个角度来说,人类的基因组可能不大不小刚刚好,其中的每一个部分都扮演着重要的角色。如果是这样,未免也太巧了。更有可能的是,人类基因组中确实有相当一部分的“无用”DNA。
这并不是说人类基因组就没有任何特别和有趣之处了。刚开始从事遗传学工作时,我曾信心十足地告诉人们,人类基因组包含约100 000个基因—毕竟我们是这么重要和特别的生物,没有足够多的基因说不过去,不是吗?然后这个估算值便开始降低……降低……再降低。到人类基因组计划完成的时候,这一数字已降至20 000出头。部分原因是我们基因的结构相当复杂,而且很多基因都有不止一个功能。有时候,这意味着以略微不同的方式完成相似的任务,就像肌肉蛋白质的组成会因其在心肌还是普通肌肉中发挥作用而有所不同;而有时候,这意味着同样的蛋白质可以做截然不同的工作,也就是所谓的“兼职”。例如,有一种酶既可以用作化学反应的催化剂,还可以保持晶状体的透明。
这其实适用于很多生物的基因组,对于黑猩猩的基因组则是完全适用。黑猩猩,尤其是倭黑猩猩(又称侏儒黑猩猩)的基因与我们相似度极高。火星人甚至可能会把我们当成同一动物的不同变种。可以说,我们与黑猩猩的关系比非洲象和亚洲象的关系还要亲近。因此,你可不能怪我们的外星朋友分不清楚了。
我们是怎么知道这些的?这又要从人类基因组计划说起。
最初构想的时候,人类基因组计划是个雄心勃勃的计划。当时,只完成了一小部分基因的测序。我们所掌握的通常是一种轮廓草图,实际上相当于一张地图。你经常听到的“绘制基因图谱”其实就是第一步。但我们现在不会绘制一个人的基因图谱了,因为这项工作早已完成了。就像你不需要整个社区的地图也能找到某个人的房子一样。基因图谱不像街道图,因为它是一维的而不是二维的,标示的无非是构成染色体的DNA链上基因的分布情况。要绘制这样的一份图谱,标记必不可少,也就是所谓的遗传标记或标记基因(genetic signpost)。这些标记之间存在着某种既定联系,而且组成这些标记的DNA片段往往可以通过独一无二的方法识别出来。假如我们有三个这样的遗传标记,分别是A、B和C。如果我们绘制一份包含这三个标记的基因图谱,它至少能够反映出它们在染色体上的排列顺序(比如说,是A—B—C,而不是A—C—B或者其他任何可能性)。更好的版本也许会告诉我们这三个遗传标记都分布在1号染色体上,而不是其他任何染色体。最为实用的图谱还能告诉我们它们之间的间隔。
最早的基因图谱是绘制于的20世纪初的果蝇基因图谱。到1922年,研究人员已经将控制50种不同性状的基因定位到了果蝇的四对染色体上,这些都是可以直接观察到的外表形态差异。研究人员会仔细确认果蝇具有的多种特征,并将它们与其他同样经过仔细检查的果蝇进行配对,对诞生的后代也要挨个仔细检查。这是一项严格而艰巨的工作,让我们学到很多遗传学的基本知识,也让我们掌握很多行之有效的方法,这些方法不仅推动了整个20世纪的遗传学研究,对人类基因组计划的成功也功不可没。
例如,下面是一份早期的果蝇X染色体基因图谱:
y...................w................................................v............m
在这一图谱中,字母“y”代表“黄体”,“w”代表“白眼”,“v”代表“朱红眼”,而“m”则代表“小翅”。这张图谱表明,黄体和白眼这两个性状密切相关,它们更有可能一起遗传,而小翅这种突变型基因则更可能与朱红眼,而非白眼一起遗传。这张遗传图谱的作者是阿尔弗雷德·斯特蒂文特,又一位几乎被世人遗忘的天才。1913年,这一成果最终以论文形式发表时,他年仅21岁。斯特蒂文特是著名遗传学家托马斯·亨特·摩尔根的学生。他似乎是一个神童,小小年纪就已经在遗传研究方面有所建树了。这个天赋异禀的少年在十几岁的时候就通过一篇文章引起了摩尔根的注意。那时,斯特蒂文特基于自己从小在父亲农场观察的经历,写了一篇关于马匹毛色遗传的论文。正是这篇文章给摩尔根留下了深刻印象,他鼓励斯特蒂文特将文章发表在科学期刊上,并邀请他加入了自己的实验室—接下来的故事不用我说你们也知道了。
这只是一个开始。
之后,斯特蒂文特开启了漫长而辉煌的科学生涯,这期间除了娶同在一间实验室工作的技术员菲比·柯蒂斯·里德为妻,他追求科学真理的脚步几乎从未停歇。斯特蒂文特和里德有三个孩子,在这样的家庭中长大的他们,想必从小耳濡目染的都是遗传学知识。
对于绘制遗传图谱的遗传学家们而言,20世纪的大部分时间里他们都在艰难摸索中前进。从使用肉眼可见的形态标记逐渐扩展到生化标记及其他遗传标记,从酵母的遗传图谱到人类的遗传图谱,都见证了遗传学家们的不懈努力。直到1987年,也就是斯特蒂文特去世17年后,第一张覆盖整个人类基因组的遗传连锁图谱才绘制完成—407个遗传标记分布在人类的23对染色体上。如果说人类基因组计划是遗传学的“登月计划”,那么斯特蒂文特早期创作的遗传图谱就相当于莱特兄弟的第一次试飞。
就这样,到20世纪80年代末,我们终于有了一张人类基因组的轮廓图。它就像那些早期探险家们手中的世界地图,勾勒出我们体内那23块“大陆”的轮廓,标示出其上散布着的一个个“路标”(那407个遗传标记)。然而,除了一些重要的“港口”—那些围绕着致病基因的已知DNA序列,在我们这份地图上几乎找不到任何其他细节。
从这样一张包含407个标记的草图到详尽的遗传图谱,最终到完整人类基因组序列的诞生,需要借助一些特殊的工具,桑格测序法(Sanger sequencing)便是其中最重要的工具之一。
你一定听说过玛丽·居里,她曾因在物理和化学领域的突出贡献两度荣获诺贝尔奖。莱纳斯·鲍林这个名字你应该也不陌生,他也是两项诺贝尔奖(1954年诺贝尔化学奖和1962年诺贝尔和平奖)得主。但我不得不承认,在我开始写这一章之前,我从未听说过约翰·巴丁。说来惭愧,似乎我们都欠这位两获诺贝尔物理学奖的科学家一声“谢谢”。巴丁是晶体管的发明者之一,同时也是BCS超导理论的提出者。可以说,如果没有巴丁的发现,就不会有你使用的手机。我能用电脑打下这些文字,也要归功于巴丁。
鉴于我们探讨的是遗传学,弗雷德里克·桑格无疑是四位两度获得诺贝尔奖的科学家中最了不起的一位。桑格是一位英国生物化学家,发现了测定蛋白质氨基酸序列的方法,并因此第一次获得了诺贝尔奖。桑格还是一名贵格会教徒,在二战期间获得了(因道义或宗教原因)拒服兵役者的正式身份,这真是万幸—倘若他不幸牺牲在了战场上,对整个世界该是多么大的损失。
桑格选择首先研究的蛋白质是胰岛素,即糖尿病患者体内缺乏(或不起作用)的一种调节血糖的激素。自20世纪20年代早期以来,胰岛素就已被成功应用于糖尿病的治疗,而在50年代早期,胰岛素也是为数不多的纯蛋白质之一。这背后的故事本身就是科学史上极为特别的一页。
关于医学突破的媒体报道往往有两种:一种是小题大做,看似夺人眼球,实则不过是数年前就取得的小小进展;另一种则是操之过急,看似前景光明,但实际上还处于动物研究阶段,或许永远也不可能应用于人体。我和我的博士导师理查德·哈维就曾接受过国家电视新闻的采访,谈论一项我们甚至还没做过的研究。在此之前,我们的这项研究得到了美国国立卫生研究院的资助,而我们研究所的公共事务部不知怎么就把这件事当作重大新闻卖给了一家电视网。几年后,当我们真正完成了这项研究并将结果发表时,我们的名字甚至都没有出现在一份地方报纸上。
纵观医学史,真正的医学奇迹也时有发生。青霉素便是个很好的例子,它的问世让许多严重威胁生命却又无法医治的传染病一下子变得有药可医。不过,要说真正的灵丹妙药,当数胰岛素无疑。
多尿症(diabetes)主要有两种味道—我特意用了这个词。糖尿病(diabetes mellitus,DM)是目前为止最常见的一种多尿症,“mellitus”源自拉丁语,意思是“像蜜一样甜”,这是因为糖尿病患者的尿液带有甜味。相较之下,尿崩症(diabetes insipidus,DI)患者的尿液是淡而无味的,说得更形象一点,如果它是款饮品,你最爱餐厅的侍酒师肯定不会向你推荐它。
根据对胰岛素治疗的不同反应,糖尿病又可以分为两大类。如果你的胰腺无法正常分泌胰岛素,那么你需要的就是一种替代品,可以通过注射胰岛素来弥补体内胰岛素的不足。这种胰岛素依赖型糖尿病(IDDM,又称Ⅰ型)是我们在这里着重探讨的类型。如果你体内胰岛素分泌正常,但起到的作用甚微,你得的就是非胰岛素依赖型糖尿病(NIDDM,又称Ⅱ型),与第一种类型截然不同。如你所料,在这两大类的基础之上,糖尿病还可以进一步细分为多种类型。本书后面的章节里就会提到一种影响新生儿的罕见糖尿病。
胰岛素的作用主要是促进组织细胞对葡萄糖的摄取和利用。离了胰岛素,你体内的细胞就如同“糖盲”—它们无法辨别葡萄糖,更别提利用了。久而久之,这些无法被细胞利用的葡萄糖就会在血液中累积,一部分会经尿排出,形成“糖尿”。葡萄糖排出体外的过程中还会带走大量水分,导致你出现多尿症状,而尿得多了,脱水的风险也就升高了。与此同时,即便你体内有这么多葡萄糖,它们也不能为细胞所用,所以你的身体细胞仍处于一种饥饿状态。
20世纪初,人们就已经知道摘除狗的胰腺会让它患上糖尿病并在两周内死亡。不幸的是,对人而言也是如此。糖尿病多发于儿童时期,而患上这种病在当时无异于被判了死刑。患者也许能够撑过几周或几个月的时间,但最终还是会陷入昏迷并很快死亡。
人类与糖尿病抗争的故事有好几位主人公,他们都是加拿大人。弗雷德里克·班廷是一名外科医生,他想到了能否从狗的胰腺中提取某种可用于治疗糖尿病的物质。此前已经有人尝试过,但均以失败告终。
胰腺除了能分泌胰岛素,还能够分泌消化酶。结合这一点,班廷认为之前人们通过研碎胰腺组织来提取这种激素的尝试之所以失败,正是因为这些消化酶在研磨过程中与胰岛素充分接触导致后者完全分解。于是,他想到了一个方法:将胰腺上用于输送消化液至肠道的胰管结扎,让合成分泌这些消化酶的腺泡细胞萎缩死亡。他希望可以通过这种方式提取出不含酶的胰岛细胞,为之后制备纯净的胰岛素做准备。为此,班廷找到了母校多伦多大学首屈一指的糖尿病研究专家约翰·麦克莱德寻求帮助。经过一番周折,他最终说服了麦克莱德教授为他提供证实这一想法所需的资源,包括10条狗和一名助手—一位叫查尔斯·贝斯特的医学生。有趣的是,在医学层级体系中,医学生的地位就比家畜略微高一点,直到今天也是如此。
据说贝斯特是医学史上抛硬币的最大赢家。麦克莱德原本给班廷派了两名学生做助手,一位是贝斯特,另一位是他的朋友克拉克·诺布尔。但班廷实际上只需要一名助手,于是他们二人决定以抛硬币的方式决定谁先与班廷一起做研究,最终贝斯特成了那个幸运儿。起初,他们打算在夏天过半之后互换,但那时贝斯特已经上手了这份工作(并且确实做得得心应手),商量后他们决定贝斯特留下来。谁也没有想到,这枚小小的硬币抛掷的是一份科学的无上荣光。
事实证明,班廷的想法是对的。初期在狗身上进行的实验取得了鼓舞人心的成果,到1922年1月,人体临床试验也提上了日程。这就要提到我们的另一个主人公,詹姆斯·克里普。他发现了纯化胰腺提取液的方法,提高了这种疗法的安全性。当时,第一位受试者注射未完全纯化的狗胰腺提取液后出现了严重过敏反应,试验不得不暂停。这时,麦克莱德教授请来了当时正在多伦多大学访问的生物化学家詹姆斯·克里普。他的加入使临床试验再次重启,很快便取得了显著成效。正是在这一时期流传了很多糖尿病患者接受治疗后奇迹般恢复的故事,其中值得一提的是班廷团队制得纯净胰岛素后的情景。据称,当时多伦多总医院里躺满了陷入昏迷、奄奄一息的糖尿病患儿,班廷等人从房间的一头开始给这些孩子注射胰岛素,他们就这样一个接一个地注射下去,等他们打到最后一个孩子时,第一个接受注射的孩子已经从昏迷中苏醒过来了。
即使这个故事是真的,你肯定也不能从首篇关于胰岛素治疗的科学报告中看出这一点。这篇刊载于《加拿大医学协会杂志》(Canadian Medical Association Journal)的文章写得枯燥至极,直到第二页过半(这篇文章总共也就五页多一点)才第一次提到这是一项在人身上开展的治疗。最后得出的结论也是慎之又慎:(简言之)“我们能够测得患者血液发生了一些变化,而且他们看上去似乎好一些了。”
然而,就算班廷和他的搭档们不愿自吹自擂,他们发现胰岛素的消息依然不胫而走,并很快在全世界引起轰动。第二年,瑞典皇家科学院授予了班廷和麦克莱德诺贝尔生理学或医学奖。班廷当天就宣布要与他的助理贝斯特共享奖金,而麦克莱德最终也决定将自己的那份奖金与克里普分享。当时,虽然发现胰岛素的消息已传遍大街小巷,但胰岛素的大规模生产尚需时日,这对于那些刚诊断出患糖尿病的患者家庭意味着什么,我们难以想象。一定有很多人还没等到胰岛素就死去了,而一些幸运的人或许能在生命的紧要关头等来这剂救命良药。
不管怎样,30年之后,当弗雷德里克·桑格需要某种纯蛋白进行研究时,他只须漫步到当地的药店买一瓶,仅此而已。所谓桑格测序法其实就是一种简化处理,桑格没有选择直接读取整个蛋白质的氨基酸序列,而是将蛋白质长链分解成了一个个短小片段。他先用独创的化学方法测得这些片段的氨基酸序列,再利用这些小片段的重叠关系将它们拼接起来,最终得出这种蛋白质的完整氨基酸序列。这一方法对科学研究产生了深远影响。众所周知,近50年之后,克雷格·文特尔的公司塞雷拉就用基本相同的方法测出了人类基因组序列。直到今天,桑格测序法仍是遗传学领域的一项重要技术。2018年,研究人员也是用这种方法完成了考拉的基因组测序。
桑格的发现绝不仅仅是得到“这是胰岛素的序列”的结论这么简单。不可否认,这一点也很重要,但更为重要的是,桑格发现每种蛋白质都有其既定的氨基酸序列,而这与它们的结构和功能息息相关。蛋白质是一个个氨基酸分子组成的长链,可以说,正是有了这一基本认识,才有了后来包括DNA编码蛋白质的方式在内的许多重要发现。
桑格没有止步于此,而是将目光转向了DNA(这也为他赢得了第二个诺贝尔奖)。1977年,他提出了一种快速测定DNA序列的方法,这种被称为桑格测序法的技术成为后来人类基因组计划的基石。最早的桑格测序法须借助一定量的放射性同位素对核苷酸进行标记,之后经过不断改进,科研人员开始用荧光标记物代替同位素,四种不同的荧光分别对应四种碱基。这不仅提高了操作的安全性,也使大规模测序成为可能。桑格测序法就这样推广开来。
今天,我们仍在诊断实验室中使用桑格测序。
现在,做桑格测序非常简单,因为我们掌握了自己感兴趣的基因序列。我们也可以用桑格测序法发现某段未知的DNA序列。这就好比你从某个熟悉的地方出发,一步一步前进,一路探索着新世界,直到遇见从另一个方向来的某个人。这就是人类基因组计划所使用的方法。
就这样,到20世纪80年代末,我们有了可以用来完成这项工作的工具。然而,要真正完成人类基因组的测序,似乎还有很长的路要走。1987年,向来以“勇于冒险”著称的美国能源部(US Department of Energy, DOE)启动了一项旨在找到一种可以保护基因组免受辐射影响的方法的计划,这对当时核能日益成为主要能源的美国而言也许至关重要。这便是人类基因组计划的雏形。到1988年,美国国立卫生研究院加入了能源部的这项计划,美国国会对该计划提供了资助。
事实上,这一早期设想照进现实只用了不到12年时间。然而,从一个旁观者的角度来看,前6年几乎没有什么进展。1990年,美国正式启动了人类基因组计划,并设定了在2005年完成这一计划的目标。但政府项目向来都以耗时长、预算不足著称,所以也没有太多人把这当回事。到1994年,人类基因组计划的主要成果是一张更为密集的基因图谱。这张新的图谱上密密麻麻地排列着5 840个遗传标记,而非此前的407个。在外行看来这也许没什么特别,但这是绘制出人类基因组的关键一步。而且,这一成果比预期提前了一年,似乎已经预示了什么。
人类基因组计划从一开始就是一项国际合作的全球性工程,来自世界各地的顶尖科学家都以各种形式参与其中。澳大利亚细胞遗传学家格兰特·萨瑟兰就是其中之一,他曾以国际人类基因组组织主席(尽管不是人类基因组计划的负责人)的身份,在该计划中发挥了重要协调作用。詹姆斯·沃森(没错,就是那个沃森)是人类基因组计划的首任主管。直到1992年,他辞去了这一职务,短暂过渡之后,弗朗西斯·柯林斯接管了这一项目直到其圆满完成。
实际的测序工作由来自美国、英国、日本、法国、德国和中国的20所研究机构完成。各机构分工明确,各司其职。美国以外贡献最大的要数位于英国剑桥的桑格中心(Sanger Centre)。顾名思义,它是以弗雷德里克·桑格的名字命名的。桑格中心,也就是现在的维康桑格研究所(Wellcome Sanger Institute),完成了近三分之一的人类基因组测序工作,负责的染色体包括人类第1、6、9、10、11、13、20、22号染色体以及X染色体(其中部分染色体的测序是与其他机构合作完成的)。直到1999年,国际人类基因组计划联合研究小组才宣布完整破译出了第一对人类染色体(第22号染色体)的遗传密码。1999年9月,在该项目启动十多年后,人类基因组8.21亿个DNA碱基测序完成的消息传出。其中有一半仍是“草图”,而且还有20多亿碱基的测序工作尚未完成。但这之后,该计划就像失控了的火车头一般加速推进,到次年6月,人类基因组计划已接近尾声,克林顿总统和布莱尔首相可以提前宣布该计划成功了。
人类基因组计划使用的是一种合乎逻辑、按部就班的测序方法,从已知的区域一步步“走”到未知的区域。但他们有一个竞争者—克雷格·文特尔,堪称“基因组学界的埃隆·马斯克”。文特尔的策略完全不同,他想用一把“霰弹枪”完成人类基因组的测序。
文特尔是位才华横溢而又不乏创业精神的科学家,但他的学生生涯算不上出彩,毕业后的他可以说是一个被学习耽误了的冲浪运动员。之后,他应征入伍,其间还曾以美国海军医护兵的身份参与了越南战争。那段在战地医院工作的经历对文特尔产生深远影响,他退役后重拾学业开始学医,不过之后又转行从事了科学研究。事实证明,他是位杰出的科学家。在美国国立卫生研究院工作期间,他曾因申请基因专利而一度陷入争议的旋涡。文特尔最终离开国立卫生研究院,并且成立自己的公司,在那里他又闯出一番新天地。作为塞雷拉公司的第一任总裁,他决定与人类基因组计划展开竞争,用的就是人类基因组计划嗤之以鼻的方法—鸟枪测序法(shotgun sequencing)。其主要步骤包括将基因组打碎成大小不一的片段,对它们进行随机测序,最后像拼图一样将它们拼接起来。
比方说,你做了几次测序后,得到了3个这样的片段:
 
GGTGTGAACTGCCCCGAGGG
CCGAGGGCAGAGACCTCCCGTTTTG
CGTTTTGTTCTCCAGCGCCTTGAGCCAGC
只要进行简单的推理计算,你就能够把它们拼在一起,就像这样:
 
GGTGTGAACTGCC
CCGTTTTGTTCTCCAGCGCCTTGAGCCAGC
仔细观察不难发现,第一个基因片段与第二个有部分重叠,而第二个片段又与第三个有重叠。如果没有第二段基因,你无法将第一和第三个基因片段联系起来。但只要一直粉碎,测序,再粉碎,再测序……最终你一定能得到足够多的相互重叠的基因片段,拼成一张完整的人类基因组。这一了不起的成就,塞雷拉真的做到了。在这场与6个国家的20所机构以及美国能源部的较量中,单枪匹马的塞雷拉与公共领域的人类基因组计划几乎同时冲过终点。这就有了文特尔与柯林斯一同出席白宫招待会,共同宣布人类基因组工作草图绘制完成的情景。
与人类基因组计划相比,塞雷拉确有一大重要优势—它可以获取所有公共机构的数据。从一开始,数据开放共享就是人类基因组计划的基本原则之一,这开创了生物医学科学领域数据共享的先河,也成为该领域沿用至今的准则。
你可能会问,塞雷拉费这么大功夫究竟是为了什么?其实,它最初的计划是发现更多的人类基因序列并对其申请专利保护。塞雷拉确实对6 500段基因序列申请了初步专利保护,但最后没有走完整个专利申请流程就不了了之了。最终,他们免费公开了这些数据(其中就包括那张寄给我们却让我们束手无策的光盘,当然,这也不能怪他们)。
事实上,人类基因组“参考”序列从一开始就是不同人基因组的“大杂烩”,当然它本应如此。人类基因组计划面向20个测序中心附近的居民招募了一批志愿者。人类基因组计划不会记录他们的个人信息,且采集的样本中真正用于测序的只占很小一部分,因此没有人知道“参考”DNA的主人是谁。今天我们使用的 “参考”基因组已经经过了无数次更新和调整,整合了很多来自不同人的基因组信息,就像一床由各种尺寸的布块缝制成的被子。塞雷拉也这么做,只不过可能没那么随机罢了。他们招募了21名志愿者,除了年龄、性别及(自我描述的)种族背景,塞雷拉没有保留他们的任何信息。所有志愿者需提供130毫升的血液样本(略多于四分之一品脱,足够用来制造一个逼真的犯罪现场了),男性志愿者还需提供在6周时间内采集的5份精液样本(塞雷拉在那篇发表于《科学》杂志的论文中提到了他们所采用的检测方法,相当有趣)。最终,这21名志愿者中只有5人被选中进行基因组测序,两男三女,包括一名非裔美国人、一名中国人、一名西班牙裔墨西哥人以及两名高加索人。
后来才发现,其中一名高加索人,一位男性,贡献尤为突出。他的名字也不再是秘密了:正是文特尔本人。仅仅几年后,文特尔完成了他剩余基因组的测序,他可能是这么做的第一人。我之所以用“可能”一词,是因为差不多在同一时间,詹姆斯·沃森也完成了自己的基因组测序,至于到底是谁先完成的尚不清楚。
那是2007年的事了。那时候,测序一个人的基因是不可思议的。现如今,这几乎已司空见惯了—只要你有这个意愿而且手里有几千美金闲钱,你就可以做一次基因组测序。成千上万人已亲身体验。
你觉得几千美元很多?要知道,人类基因组计划光是绘制出第一份人类基因组草图就花了近30亿美元。据估计,在2001年,测序一个人的基因组差不多要花1亿美元。之后,随着技术的不断进步,测序成本大幅降低了。如今,也许只用花不到1 000美元就能做一次基因组测序,且检测成本仍在下降。相比之下,分析测得的基因组数据才是更大的挑战。为了更直观地感受测序成本的降低,你可以把基因组测序想象成一辆崭新的兰博基尼,零售价428 000美元。而如果按基因组测序的成本降幅换算,你就能以4.30美元的超低价提一辆锃亮的新座驾了。
身上有几块钱吗?咱们开着这个宝贝儿去兜风吧!
 
 

第三章 那个并不矮的男孩

试图改变人的本性,注定是徒劳。
—阿里斯托芬
 
 
不同的人易犯的错误也各不相同。我特别容易犯的错误恰恰是很多魔术的基础。魔术师表演魔术多少都要依赖“误导”—将你的目光引向别处,让你注意不到眼前正在发生的大事。在医学领域,“误导”可能来自其他医生、患者本人或纯粹的阴差阳错,而这往往会导致低级错误,即那些但凡你的关注点正确就绝对不会犯的错误。
如果说魔术的艺术是“误导”我们,那医学的艺术往往是找到不被“误导”的方法。我们常说“新手易中的陷阱”,殊不知,老手也可能陷入其中。
几年前,一位有年资的全科医生将一个小男孩转诊到我这儿,以查明是什么原因导致他身材矮小。这有点不寻常,因为大多数情况下全科医生会让孩子先去看儿科医生,之后可能再去看内分泌科医生(他们是激素方面的专家,其中就包括控制生长的激素)。不过,很多遗传病也可能导致孩子身材矮小。从这个角度来说,就身高问题参考遗传学家的意见虽然不太多见,但不无道理。这个小男孩的情况十分令人担忧,因为他的身高增长趋势短时间内呈现了跨曲线的显著放缓。
儿科医生使用百分位曲线图来跟踪儿童的生长。这些图表能够反映儿童正常的生长变化过程,各个曲线代表了不同的百分位数。例如,3%的儿童身高高于第97个百分位,25%的儿童身高低于第25个百分位,50%的儿童体重低于第50个百分位……大多数孩子在大多数时候都会沿某一特定曲线生长。从小就相对矮小的孩子,之后很可能也不高。
生长百分位曲线图的优点在于,你可以很容易地依据它来判断孩子的生长发育是否正常。如果孩子有个大脑袋,这仅仅是家庭遗传使然吗?要找到这个问题的答案,就要按同一条百分位曲线来持续跟踪这个孩子的头围。他的头围是否跨越了上方的曲线?如果是,那可能是个问题。如果增长幅度过大,他很可能需要做一个脑部扫描。同样,如果一个人一直沿一条特定的身高曲线生长,然后身高突然掉了下来,就像这个故事里的小男孩一样,就有些令人担心了,也会立刻引起我们的关注。生长发育是孩子们最重要的事情之一,所以一旦他们停了下来,找出其中的原因至关重要。当然,这并不是说这个小男孩“缩水”了,而是在我们原本以为他会长7厘米的阶段,他只长了1厘米。
像接诊每一位新病人一样,我走完了整套流程。我询问了这个男孩的家人有哪些以及他们的身高如何。我了解了他母亲怀他时的情况、他出生时的情况和早期的生长发育情况。我给他做了检查,特别是看他有没有肢体发育异常,以及四肢和身体是否成比例。我还检查了他手掌的褶皱,因为如果手部的骨头很短,就会表现在手掌的褶皱上。
我一无所获,哪怕是一丝一毫的异样也没有。这个孩子看上去完全正常,无论从哪个方面来说,他一直都表现得不错,直到他的身高曲线陡然下降。
我的关注点又回到了身高曲线图上。幸运的是,男孩的母亲带来了他的“蓝册子”,也就是新手父母用来记录孩子健康信息的册子。更幸运的是,这个册子里还有很多这个孩子之前量身高的记录。我把这些数值标在了身高百分位曲线图上,答案马上就出来了。
除了9个月前测的一次高于第90个百分位,他目前为止测得的每一次身高数值都略低于第25个百分位。现在想想,9个月前的那个数值肯定有问题:这个男孩的身高并没有从第90个百分位跌至第25个百分位以下,因为他从来就没达到过第90个百分位。
这个男孩并不矮,当然也不需要来找我看病。我并不认为这次看诊浪费了我的时间。从长远来说,这个孩子的母亲也绝对没有白跑一趟,因为这次转诊可能救了她的命。
在我还是一个医学生的时候,癌症是个神秘的东西。这倒不是说我们对它完全一无所知,恰恰相反,我们知道很多东西都可能诱发癌症。比如吸烟,这点毋庸置疑;还有石棉及某些病毒,如艾滋病(HIV)病毒。吸入芥子气也会导致癌症,不过幸运的是这种情况如今已经很少了。在澳大利亚这一黑色素瘤的世界“中心地带”(但欢迎来玩,你会爱上这里的),罪魁祸首当然是太阳。
我们甚至还知道有几种癌症会遗传,同时,早在20世纪50年代末就有证据表明癌细胞中存在基因变化现象。特别是在1959年,费城的两名研究人员(彼得·诺威尔和戴维·亨格福德)发现,在一些白血病细胞中,22号染色体异常短小。这种异常的22号染色体被命名为费城染色体(the Philadelphia chromosome)。1973年,珍妮特·罗利发现,这种染色体之所以短小,是因为该染色体的一部分断裂并附着到了9号染色体上。事实证明,这一发现至关重要,因为它是在人类癌细胞中发现的第一个染色体异常现象。
多年以后,科学家们找到了费城染色体的致癌机理。两条染色体断裂的位置恰好位于两个不同的基因中间。费城染色体易位打断了这两个基因,同时又组合成一个新的极度活跃的融合基因。正是这一融合基因造成细胞生长失控,最终导致白血病的发生。这一发现反过来又催生了一组治疗某些特定癌症的新药(我们将其统称为“酪氨酸激酶抑制剂”)。
在过去几十年里,科学家们对癌症生物学进行了析毫剖厘的研究。结果表明,癌症几乎完全是一种基因组疾病。归根结底,癌细胞基因组中的罪魁祸首就是细胞“加速器”和“刹车”的失衡。
生长发育是生命的基本特征。刚受孕时,你只是一个细胞。就细胞而言,它的个头很大,直径差不多有一绺头发那么宽,但它仍然是个非常非常小的东西。细胞最重要的任务之一就是生长,随着细胞不断分裂,信号就会传递给新的子细胞,促使它们增殖扩张。子细胞们接收到信号都乖乖照做了,而且多亏了你妈妈提供的丰富营养,它们都干劲十足。
这一切都很美好—直到问题产生。你的子细胞不断增殖再增殖,但不管它们如何增殖,也只是一团越来越大的细胞罢了,你早晚要做点什么。你需要一个形状,为此要让一些部位的细胞继续生长,而另一些则需要停下来,甚至需要让一些细胞死亡。受孕6周后,你的体重已经是你还是一颗受精卵时的快500倍了。如果你继续以这个速度生长,相信不用等到一周岁,你就已经比地球还重了。
这意味着,为了平衡第一阶段的加速生长,你的细胞还需要“刹车”。实际上,远远不止刹车那么简单,因为它们还要做各种各样的决定。比如,哪一端是顶部,哪一端是底部?哪边是左边,哪边是右边?比如,人体内有一对名为LEFTY1和LEFTY2的基因,单看它们的名字就能找到答案。一旦你确定了顶部、底部、左边和右边,前部和后部也就确定了。这个时候的你还只是个团状物,但一切才刚刚开始。
接下来发生的变化可谓叹为观止。蛋白质以其独特的舞蹈来相互传递信号。指令会传达至每一个细胞,告诉它们接下来的命运:“你,还有你所有的子细胞,都会变成皮肤细胞”“你会成为神经细胞”“你会成为肝细胞”“沿着这条线生长”“等你到这个地方就停止生长”“不管你的工作是收缩以让心脏跳动,是发射电信号,让大脑正常运转,还是过滤净化血液,产生尿液,都马上行动起来!”
一些细胞接收到的信息是“你会死亡”。其实,这对生命活动有着多方面的重要意义。细胞程序性死亡是人体发育必经的一个过程,它可以帮你清除体内不需要的细胞。最好理解的一个例子就是四肢的发育。你的胳膊最开始是个小结节,之后会发育成鳍状,而你的手起初只是它末端的一个小疙瘩。要想发育形成手指,你指间的细胞必须消失。于是,它们就程序性死亡了。
这种传递给细胞的“死亡指令”在之后的生命过程中也发挥着重要作用。生病或受损的细胞可以启动“自毁”程序。如果没有这种机制,异常的细胞可能会过度消耗能量,毒害周围的细胞,妨碍其他正常细胞的活动,甚至转化成癌细胞。
因此,细胞接收到的信号共有三种:一是“加速器”——生长;二是“刹车”——停止生长;三是死亡。只有这三者的平衡才能维持人体正常的生理活动,而这种平衡的标准又因细胞而异。事实上,对于很多单个的细胞而言,“刹车”完全锁定。例如,一旦某个细胞发育为成熟白细胞,它基本上就不会再分裂了。而它一旦受损,就会被你骨髓中的干细胞所取代。干细胞是一种未完全分化的细胞,它们在人体各组织器官中徘徊待命,在身体需要的时候再进行分裂。干细胞每次分裂产生的一个子细胞会分化成所需的血细胞(也可能是肝细胞或肌细胞,视情况而定),另一个子细胞则作为干细胞继续待命。而一些其他类型的成熟细胞(如皮肤细胞)会保持分裂和自我更新的能力。
在人体的一些部位(如软骨和大脑),细胞的生命周期很长,几乎不需要更新。在其他部位,细胞的新陈代谢十分旺盛。皮肤细胞和肠壁细胞就是很好的例子,它们一直都在不断更新换代。这种频繁的细胞分裂无疑增加了出错的风险,这也是皮肤癌和肠癌如此多发的原因之一。
细胞的每一次分裂一般都伴随DNA的复制。想象一下,两套由30亿个碱基对组成的遗传信息要在短短数小时内完成复制,还是在一个非常狭小的空间里,出错也就在所难免了。其实,这样的错误一直都在发生,只不过大多数情况下,它们都会及时被DNA纠错机制发现并修复。但即便如此,还是会有不少“漏网之鱼”。一般而言,人体由约30万亿个细胞构成。如果按平均寿命来计算,这意味着人一生要经历约1016次细胞分裂。这比人体内细胞的数量多得多,究其原因,受精卵最终发育为成人要经历无数次分裂是一方面,死亡细胞的更新换代也离不开细胞分裂是另一方面。
那么,逃脱了细胞纠错机制的“漏网之鱼”到底有多少呢?一般情况下,你的DNA中存在40至80处突变,你体内每一个细胞的DNA都是如此。这些突变并不是你的双亲遗传给你的,却会通过你遗传给你的孩子。大多数情况下,这种突变源于父亲的精子。因为与漫长而精细的卵子产生过程相比,精子产生速度快、数量多但质量相对较低。
这些DNA中的新变化要紧吗?这取决于突变发生的确切位置。一些特定区域的基因突变会产生很大的影响,之后的故事就充分印证了这一点。大多数情况下,突变都发生在一些无关紧要的位置,如基因之间,或者其他任何把C换成T或把A换成G都没什么区别的地方。
那你身体生长发育所必经的1016次细胞分裂呢?其间DNA复制的准确度又如何?最近的一项研究表明,通常情况下平均每次细胞分裂都会产生一个新错误。的确,事实就是如此—几乎每一次细胞分裂都会出现这样或那样的问题,基因组的复制自然也不完美。每一分每一秒你的基因组都在衰退。确切地说,你有的不是一个基因组,而是数万亿个与你与生俱来的基因组略有不同的基因组。几乎没有两个细胞的基因组成完全一样。
设想一下,你有30亿个DNA碱基对,而它们有1016次被错误复制的机会,那么实际上在一个人的一生中,每种可能的遗传变异都要发生无数次。不管是“刹车”基因受损失灵,还是“加速器”基因“关”不上了,抑或像费城染色体那样催生出一种全新的“加速器”基因,发生的概率都很高。
说到这儿你也许会问,那我们是怎么活到现在的,怎么可能从受孕到出生都没有患上癌症,更不用说还能健康地活过童年、长大成人?
这个问题实际上有几个不同的答案。首先,也是最为重要的一点,健康细胞到癌细胞的转变不是一夜之间发生,(通常)也不是单一基因突变的结果。人体内一般都有“备份”机制,因此大多数情况下,单纯一个突变并不足以引发癌症,只有更多基因突变累积在一起,并且在同一个细胞内,才会导致癌症的发生。但要弄清到底需要多少基因突变有点难,因为癌细胞的一大特点就是其DNA复制往往带有“随意性”,因而容易出错。但其中有一些突变并不是导致细胞癌变的原因,相反,它们是细胞癌变过程的产物。也就是说,癌细胞的DNA中,除了“司机突变”,还有“乘客突变”—它们不会直接导致癌症,但搭了这趟“顺风车”。所以,我们在研究癌细胞DNA的时候,有时很难判断到底谁才是真正的罪魁祸首。
如今,通过利用全基因组测序技术对肿瘤进行测序,并将其与正常组织基因组进行对比,我们能够更为直观地认识正常细胞癌变背后的机理。结果表明,真正导致癌症的基因突变可能并没有那么多,通常六七个足矣,对某些癌症而言可能更少,也许只有一两个。但别忘了一点,这些突变必须以某种特定方式组合在一起才能诱发癌症。毕竟我们的身体里都有大量的致癌突变,它们就待在那里,不声不响。
这到底有多可怕呢?这么说吧,如果你是个神经质的人,还是跳过下面的部分为好。
2015年,一组来自英国的科学家曾展开过相关研究,旨在证实这一问题的严峻性(虽然他们不一定这么想)。当时,有四个做上眼睑下垂手术的人捐献了切除的多余皮肤用于研究。这些皮肤组织在显微镜下看起来完全正常,研究人员从中提取了234份微小活组织样本进行检查,并读取了每一份样本的基因序列。他们只重点观察了74个已知的与癌症有关的基因,寻找其中是否有潜在致癌突变。
我不知道他们的预想如何,但他们的发现着实……令人不寒而栗。
我们为什么没有死于癌症呢?首先,只有当这些突变碰巧都发生在同一细胞中时才会引发癌症。其次,你的免疫系统非常善于消灭癌细胞。任何癌细胞想要在你体内站稳脚跟并发展壮大,都要先过免疫系统这一“细胞警察”的关。这也是为什么有免疫缺陷的人患癌的风险会增加。
还有一类人,他们患癌症的风险也比一般人高。他们不幸从父母一方那里继承了一个有缺陷的“刹车”或“加速器”基因。设想这种突变从一开始就存在于他们体内的每一个细胞中,潜在的原癌基因自然就抢占了先机。这就有了所谓的肠癌家系、乳腺癌家系、卵巢癌家系……
在这样的家系中,癌症的发病年龄往往要小得多,这是因为癌细胞在更早以前就已经开始酝酿了。因此,当我们看到一个家族中有多位成员罹患与某种特定基因相关联的癌症(如乳腺癌或卵巢癌),且他们中的很多人都是在年轻时确诊的,我们就会怀疑该家族中存在某种癌症的家族遗传现象。
很多癌症都有家族遗传性,但这种情况大都很罕见。迄今为止最常见的包括肠癌、乳腺癌及卵巢癌的家族性遗传。其实,判断一个家族中是否存在遗传性癌症并不总是那么容易。一方面,癌症如今已十分常见,因此很难分辨它到底是与家族性癌症综合征有关,还是仅仅由于坏运气使然。另一方面,有癌症家族史只意味着患癌的风险增加,而非一定会患癌,很多人继承了致癌的基因缺陷却仍安然无恙,一生都没有受癌症的困扰。除此之外,性别也是一大影响因素。同样是继承了一种乳腺癌基因(BRCA1或BRCA2)突变,男性患癌的概率要比女性低得多。当然,他们也可能罹患乳腺癌,概率也比一般人群高得多,但与女性相比仍属罕见。与此同时,携带这种突变的男性患其他癌症的风险也会增加,只不过其发病机制并不那么明确。所有这些都意味着癌症的家族遗传有时十分复杂,难以辨别。
这也曾是那些最初试图寻找这些基因的科学家所面临的一大挑战。如今,遗传学家只需对极少数患者进行研究,就有可能找到某种遗传病的致病基因。这一方面要归功于我们已掌握的人类基因组序列,另一方面也与强大的新一代基因测序技术密不可分。例如,我前不久带了一名叫艾玛·帕尔默的博士生,现在她正致力于癫痫性脑病(the epileptic encephalopathies, EEs)的研究。这是一组多发于婴幼儿的严重神经系统疾病。科研人员发现,至少四种不同基因的突变都可能导致这种疾病的发生,而在寻找这些基因的过程中发挥主要作用的正是当时还在读博的艾玛。毋庸置疑,艾玛是位出色的研究员,但在过去,一位博士生能取得这样的成就不可想象。
20世纪80年代末一直到90年代中期,见证了科学家们为寻找BRCA1 和 BRCA2所付出的艰苦卓绝的努力。这两个基因都属于“刹车”基因,一旦它们发生突变,就会使细胞踩刹车的“脚”(假装它们有)略微松开。几十年前,科学家们就已经注意到一些家族中存在一种可遗传的乳腺癌或卵巢癌,这些家族中的成员确诊癌症的平均年龄比一般人群要小。此后多年间,研究人员一直在寻找能够帮助他们定位相关致病基因的遗传标记。还记得上一章的果蝇基因图谱吗?这一次研究人员想要寻找的不是“黄体”“白眼”等肉眼可见的性状间的连锁关系,而是与癌症基因相关的特异DNA片段(即分子标记),离目标基因越近,这种连锁就会越紧密。
成百上千名研究人员夜以继日地工作,无数有家族史的乳腺癌或卵巢癌患者自愿参与研究,只为找到这两个基因。1990年,加州大学伯克利分校玛丽·克莱尔·金博士率领的研究团队宣布,他们已经把BRCA1的定位范围缩小到了人类基因组第17号染色体上。其后,金博士团队及其他研究团队顺着17号染色体一点点寻找,又将这一范围进一步缩小。1994年5月,美国犹他大学的一个研究小组与英国剑桥大学的研究小组合作发表了一份BRCA1基因所在区域的详细基因图谱。当时的这份图谱仅包含了20多个基因,BRCA1肯定就在其中。终于,到1994年10月,寻找该基因的竞赛终于落下了帷幕。犹他大学的马克·斯科尔尼克和同事宣布他们成功分离出BRCA1并发表了该基因的序列。消息一出,便轰动了整个遗传学界。同年,由斯科尔尼克团队创立的万基遗传科技公司(以下简称万基公司)为该基因申请了一项专利。然而这只是个开始,其后,该公司又获得了BRCA1相关的多项专利授权,几乎垄断了BRCA1检测的市场,但尝到甜头的万基公司并没有止步于此。与BRCA1基因的发现过程类似,在多国科研团队的协同努力下,BRCA2最终被定位于第13号染色体。1995年12月,英国癌症研究所的迈克尔·斯特拉顿教授团队精确定位了BRCA2,并在《科学》杂志上发表了该基因的序列。但就在那篇论文发表的前一天,万基公司宣布他们也找到了这一基因,并且已为其申请了专利。
在遗传学界的大多数人看来,申请基因专利似乎十分荒谬,过去如此,现在亦如是。毕竟万基公司只是这两个基因的发现者,而非发明者。此外,他们的这一发现,离不开那些公共资金支持的研究小组为绘制基因图谱所做的不懈努力,也离不开无数参与研究的志愿者所做的无私奉献。一家公司想从如此来之不易的基因中牟利,实属不该。事实上,万基公司不仅获利颇丰,而且长期以BRCA1和BRCA2基因专利持有者的身份自居。
围绕这两个基因的专利之争在世界各地以不同的方式上演。在美国,万基公司垄断了诊断性BRCA1/BRCA2检测市场近二十年,包括美国分子病理学协会、公共专利基金会等在内的多个组织就该公司持有的基因专利权问题向联邦地方法院提起诉讼。其间,联邦巡回上诉法院曾两次判定万基公司的基因专利权有效,直到2013年6月13日,美国最高法院做出终审判决,终止对万基公司持有的5项BRCA1/BRCA2核心专利的保护。在澳大利亚,一家名为基因技术有限公司(Genetic Technologies, GTG)的基因测序公司持有人类基因组全部非编码基因的专利权,换言之,该公司拥有大部分人类基因组序列的专利。但容我“剧透”一下:基因技术有限公司也不是这些基因的发明者,但仍被授予了专利权,并声称万基公司侵犯了这项专利。这场专利之争最后以基因技术有限公司获得BRCA基因在澳大利亚的专利权而告终。这一判决在当时备受争议,因而也从未真正执行,直到2015年,澳大利亚高等法院判定基因技术有限公司持有的这些基因专利无效。判决一出,整个遗传学领域长舒了一口气。
据说,女性拥有的亲戚数量是男性的两倍。因此,如果我们探寻一位女性的家族史,她能告诉我们的信息通常是她兄弟的两倍多。千万别小看这一点,有时这真的很重要。记得第一次见到那个并不矮的男孩时,我就是从他母亲那儿了解的家族史,因为我们通常都这么做。她告诉我,她50岁的堂(表)姐前不久被诊断出了乳腺癌,此外她还知道家族中有两个亲戚年纪轻轻就因乳腺癌去世,还有一位死于卵巢癌。但她此前并不知道乳腺癌和卵巢癌可以遗传,自然也从未想过咨询医生的意见,退一万步讲,我们医生一般也会先为已经确诊癌症的人做基因检测。从这个角度来说,假如她堂(表)姐的父亲了解相关家族史,并将这些关键信息传递给了女儿的医生,医生原本是能够将这些蛛丝马迹拼接成一个完整的家族遗传链条的。
所以听完孩子母亲的家族史介绍,我就马上安排她堂(表)姐到专业癌症遗传学检测机构做检测。结果显示,她是BRCA1突变的携带者。之后,那个男孩的母亲也决定去做检测,发现自己也继承了该缺陷基因。当然,从某种意义上说,这对她而言是个坏消息—不知道自己属于患癌高风险人群可能要好得多。这也给了她更多选择,包括进行更为全面的癌症筛查,这样就有可能及早发现癌症,治愈的机会也更大。此外,她还可以选择通过预防性手术来降低患癌风险,即提前切除卵巢和乳腺,不给癌症以任何可乘之机。这是个艰难的选择,但它确实能够有效降低BRCA1突变携带者死于癌症的风险。对于这一家族中的其他女性而言,她们也因此获得了做基因检测的机会。早晚有一天,这将会挽救这个家族中某个人的生命。
虽然我是一名医生,但安吉丽娜·朱莉挽救的生命比我已经或是希望挽救的要多得多。在她分享了如何发现自己携带BRCA1突变,以及选择接受预防性手术降低患癌风险的故事后,我们国家大大小小的癌症遗传学检测机构都人满为患。无数人开始重新审视自己的家族史,他们纷至沓来,想要通过基因检测求得一份心安。我们称这种现象为“朱莉效应”。那段时间,我们的实验室里堆满了采集来的样本,其中很多都检测出了BRCA1/BRCA2突变阳性。与此同时,在澳大利亚和美国,像朱莉那样接受预防性手术的人数翻了一番,可能在许多其他国家也是如此。正是因为朱莉当年选择了勇敢发声,很多人才幸免于难。
诚然,BRCA1/BRCA2突变携带者患癌的风险要比一般人高得多,但就每一个个体而言,一切又都是未知的。同样是携带了突变基因,有的人与它相安无事,而有的人却因它英年早逝。这也就意味着,预防性手术到底做还是不做,谁也没有确定的答案。事实上,在不确定性中选择是遗传学永恒的命题,也是我们下一章要探讨的主题。
 
 
 

第四章  不确定性

洗牌的是命运,但打牌的是我们自己。
—亚瑟·叔本华
命运不是一只翱翔的雄鹰,它像老鼠一样蹑手蹑脚。
—伊丽莎白·鲍恩
 
 
杰森已经记不清家里平静无事时的模样了。那也许在他还是个小男孩的时候,但后来一切都变了。他父亲的情绪开始剧烈波动,有时还会无缘无故地大发雷霆。虽然从未升级为任何暴力行为,但还是让杰森的父母陷入了无休止的争吵;而这一吵就是数年。最终,在杰森12岁时,他的母亲打包好所有的东西带着他和姐姐离开了这个家,到另一个州生活。这一别,杰森就再也没见过他的父亲。
多年以后,回想起那段黑暗的日子,杰森会想也许那时他的父亲就已经生病了,而正是这种病最终夺走了他的生命。
记得我第一次见到杰森的时候,他刚步入而立之年。他和未婚妻劳伦已经同居两年了,想到结婚、生子以及携手相伴的未来,一切都看似那么美好。但眼下,杰森只想知道自己到底有没有未来。
杰森带来了一封他八年前收到的信。这封信的开头是“敬启者”,信中提到,杰森的父亲被诊断出患有一种叫作亨廷顿病的遗传病,这意味着他的亲戚也有罹患这种疾病的风险。有鉴于此,特以这封信的形式传达这一关键信息,以供收信人进行相关临床遗传咨询时参考。
按遗传病的标准来说,亨廷顿病并不罕见—每10 000人中就有1人患有这种病。这是种非常残忍的疾病,主要表现为三大症状:运动障碍、精神障碍以及进行性认知障碍。亨廷顿病发病年龄和病情进展的个体差异非常大,最典型的情况是一个身体向来很好的人到了40岁后就会开始表现出一系列症状。起初,这些症状都很轻微,人们很容易把它们当成步入中年的正常衰老现象而付之一笑,根本不会将其与行动笨拙、性格淡漠、焦虑不安等不好的迹象联系在一起。有人可能会开始察觉出一些异样:得了这种病的人会不由自主地运动,主要表现为面部和四肢的抽搐;抑郁可能会接踵而至;他们的身体渐渐失去平衡,稍微复杂的动作都难以完成。随着时间的推移,这种脑功能的减退会愈发严重,最终患者会丧失自理、行动、说话以及吞咽的能力。所有这些症状需要数年才会逐步显现,因而大多数患者发病后还能存活10年甚至20年。简言之,亨廷顿病是一种病程缓慢的神经退行性疾病。
对亨廷顿病最早的描述始于19世纪上半叶,正是从这些描述中,研究人员发现了这种病的家族遗传性。亨廷顿病是一种常染色体显性遗传病:如果你是一名亨廷顿病患者,那么你的孩子就有50%的概率继承致病基因而具有患病风险。亨廷顿病是由负责编码亨廷顿蛋白(huntingtin,HTT)的HTT基因发生突变导致,但这种突变有些特别。究其原因,亨廷顿病其实是一种三联体重复序列疾病。说到三联体,你应该还记得第一章提到的三联体遗传密码吧,它由三个碱基为一组排列而成。HTT基因上有一段三联体重复序列:CAG CAG CAG CAG CAG……
其中,CAG密码子编码一种叫作谷氨酰胺(glutamine)的氨基酸。亨廷顿病的发病机制就是这段CAG重复序列异常扩增,编码产生带有异常聚谷氨酰胺片段的亨廷顿蛋白。之所以用“异常”一词,是因为我们大多数人HTT基因外显子上的CAG重复次数不会超过35次,通常是15—20次,因而不会患上亨廷顿病。CAG重复次数在36—39次之间的人则可能发病,有时比一般发病年龄要晚,病情进展也更为缓慢。幸运的话,他们可能永远都不会发病。那些CAG重复数在40次及以上的人就没那么幸运了,除非他们因其他疾病先行一步,否则亨廷顿病发病是早晚的事。
话说回来,是不是只要CAG重复数不超过35次就可以高枕无忧了呢?也未必。如果CAG重复扩增数达到27次或更多,在精子或卵细胞的形成过程中,细胞的DNA复制机制会不堪重负,出错也就在所难免了。这种错误非常特别,说得形象点就是DNA复制机制在复制这一段重复序列时可能会“打滑”,像极了一张卡住的唱片—CAG CAG CAG(跳过)CAG CAG(“咦,我刚复制到哪儿了?算了继续。”)CAG CAG CAG……这就意味着,亨廷顿病患者的后代遗传得到的CAG重复序列可能比他们的父母更长(有时也可能更短)。
还有一点,视致病重复序列来自父方还是母方。虽然背后的原因还不得而知,但这一点至关重要。总的来说,从父亲那里继承这种致病重复序列要比从母亲那里继承更糟。这是因为父系遗传的CAG重复序列缩短的概率比母系遗传低得多,发生扩展的可能性却高得多,而致病重复序列越长,发病年龄就越小。所有这些因素作用的结果之一就是亨廷顿病在家族中呈现逐代加重的趋势,即发病一代比一代早,且病情进展一代比一代迅速。不只亨廷顿病,很多遗传病都是如此,这种现象叫遗传早现(anticipation)。当初遗传学家们为了弄清到底哪些遗传病存在这种逐代加重现象,可是花了不少功夫。一方面,这种现象本身就有些怪异和出乎意料;另一方面,很多时候遗传谱系图表现出的遗传早现仅仅是巧合使然。这种巧合部分要归结于一个现实,即一个家系中首个被诊断出患有某种罕见遗传病的人往往是病情十分严重的孩子。孩子的父母也是这种病的患者,只不过症状可能比较轻。这种情况看起来很像遗传早现,退一万步说,即使它并不是,可能也需要再见上好几个家庭才能完全排除这种可能性。
相信读到这里,你大概也认识到了遗传早现这一问题的严重性。以亨廷顿病为例,如果遗传早现意味着发病年龄逐代提前,那么按照这一趋势发展下去,最终的结果也许是患者在很小的年纪就会发病—这完全可能。少年型亨廷顿病(Juvenile Huntington's Disease, JHD)一般在20岁之前发病,而儿童有时甚至会在5岁时就出现症状。如此年幼的孩子被诊断出亨廷顿病对一个家庭而言无疑是双重打击:几乎可以肯定,孩子的父亲也是CAG重复扩增序列的携带者,虽然序列的长度可能没那么长,但发病也是迟早的事。
为了能让你更设身处地体会杰森来找我时的感受,我想再补充关于亨廷顿病的最后一点:至少到目前为止,这种病仍无法治愈。当然,有一些治疗方法可以缓解亨廷顿病的症状,但都只是权宜之计,这种残忍的疾病一旦发病就会愈发变本加厉,像一辆永不回头的重型卡车,缓缓地驶向那唯一的终点。
现在,我们假设你有50%的概率抽中亨廷顿病这张烂牌,而我们可以通过一个简单的基因检测告诉你答案,这时你会如何选择呢?
事实证明,大多数人的选择都是坚决不做检测。近九成的人明知自己有患病的风险,却仍决定这么做。这背后的原因不尽相同。许多人认为,即使知道了这一可能改变他们命运的答案,还不是徒增忧虑却又无能为力?既然如此,还是不知为妙。对另一些人而言,与其接受检测得到一个肯定的坏消息,倒不如保留悬念,或许等待他们的是健康平安的一生呢?毕竟,对于有些东西,你知晓一切也无计可施。
也就是说,只有为数不多的人会找遗传学家做这项检测。读到这儿,你大概会觉得如果换作是你,你一定会选择做检测,但我想说你很可能是错的。当被问及如果面临这一选择是否会选择接受检测的时候,约80%的人回答“是”,这几乎与实际情况相反。这种人们在面对现实选择时所表现出的心中所想与实际所做之间的差距有一个名词,叫作“意向-行为差距”(the intention-behaviour gap)。其实,这一现象不仅适用于是否做亨廷顿病检测这样非常私人和关乎人生的决定。不知道你有没有过这样的经历:心血来潮注册了健身房会员,到头来却发现自己去健身的次数其实寥寥无几。这便是我们所说的意向-行为差距。
话虽如此,那些真正选择接受检测的人往往都下定了决心。有时,来找我做检测的人中不乏像杰森那样等待了数年才勇敢迈出第一步的人。据我的经验,只要成功说服自己迈进我的诊室,你会反悔的可能性小之又小-—这些年来,我见过的在步入我诊室大门的那一刻或是刚进来之后临阵脱逃的人用一只手都能数得过来。如果这种情况真的发生了,一般也是在最后一刻。我们部门的档案中有一个密封的信封,里面装的是一位男士的亨廷顿病基因检测报告。他在接到电话得知自己的检测结果已经出来的那一刻改变了主意。那个未拆开的信封就这样静静地在那里等候着它的主人,而这一等就是15年。如今这么多年过去了,想必他不用拆开信封也已经知道答案了吧—出现症状或安然无恙,二者中的一个,答案显而易见。
不过,不时也有人来找我做亨廷顿病检测,却并不怎么想知道结果如何。他们的情况多半与杰森类似:想要组建家庭、为人父母,不想把致病基因传给孩子。针对这类群体,我们有一项特别的检测方法—排除法。
亨廷顿病的致病基因HTT位于人类基因组第4号染色体上。我们所谓的排除法亨廷顿病检测,就是要确保胚胎继承的是杰森母亲而非他父亲的4号染色体。这是因为杰森体内有两条4号染色体,一条来自他父亲,另一条来自他母亲,而携带亨廷顿病致病基因的是他的父亲。也就是说,杰森会随机地把他父亲或者母亲的那条4号染色体遗传给他的孩子。因而如果胚胎继承了它祖母的4号染色体,那就完全没有什么可担心的了。换言之,检验人员不需要找出杰森父亲的亨廷顿病基因在哪一条4号染色体上,也能够得到想要的答案。这样,我们既可以尊重杰森本人不想知道自己检测结果的意愿,又能够确保他的孩子不会患上亨廷顿病。
杰森和劳伦仔细考虑了这个方案,但杰森已经下定了决心:他要知道自己的命运会何去何从,才能规划未来。我见到杰森的时候,已经是他第二次来我们医院了—他已经见过我的同事,遗传学顾问丽莎·布里斯托(Lisa Bristowe)了。丽莎向他们二人详细解释了亨廷顿病检测的相关事宜,包括检测做还是不做及其各自的理由,检测结果可能对保险产生的影响,以及杰森应如何应对可能的结果,等等。丽莎向来都对潜在的危险信号十分敏感:不好的检测结果对面前这个人会是毁灭性打击吗?结果出来的时候他需要特别的心理支持吗?我们已经安排杰森去看了神经科医生,检查结果显示他目前并没有患亨廷顿病的迹象。这意味着如果杰森最后的检测结果是亨廷顿病基因阳性,就说明他虽然现在没有发病,但迟早都难逃罹患亨廷顿病的厄运。我们还提出为他约一位心理医生,但杰森拒绝了。
这次会面,我们又把一些关键问题快速过了一遍,还进一步讨论了亨廷顿病这种疾病,然后安排了检测。准确地说,我们为杰森安排了两次检测。通常这种预测性基因检测我们都会做两次,一来是为了减小检测结果出错的概率,二来是因为实验室错误的罪魁祸首往往是弄错了检测样本。两管不同的血液样本被搞混的情况已属罕见,而如果采集两份样本分别送检进行独立检测,出错的概率就微乎其微了。
六周后,我们又见到了这对夫妇。那天早晨,我拿着装有杰森检测结果的信封向门诊走去。我们约好见面的时间马上就到了,杰森夫妇也已到达医院,正在等候我们的到来。这时,我拆开了手中的信封。
老实说,我并不怎么相信运气。但说来也巧,杰森来找我的时候适逢我被命运之神眷顾的一段时间,长达两年的时间里,我所检测的人收到的竟无一例外都是好消息,杰森也不例外。
虽然杰森和劳伦肯定不这么认为,但对于丽莎和我而言,预测性基因检测是再常规、再直接不过的亨廷顿病检测手段了。不过,有时这种看似简单的检测,反而会让事情变得复杂。假如有这样一对同卵双胞胎姐妹,她们有50%的概率会患上亨廷顿病,其中一人想接受基因检测,而另一个却不想。问题在于,这种情况下你检测了一个人,实际上也就相当于检测了另一个人。当然,我们不会把检测结果告诉双胞胎中的另一个,但她无意中发现的概率有多大?或者换句话说,这个秘密到底能瞒多久呢?
就算不知何故,她对这个结果一无所知,但她的双胞胎姐妹知道那个可能影响她们二人的答案,这是不争的事实。想象一下这样一个情景,你就是那个“蒙在鼓里”的双胞胎之一,正和自己的双胞胎姐姐(妹妹)聊天。本来,这只是姐妹间再普通不过的交谈,但因为一个预测性基因检测,一切都不一样了:此刻坐在你身旁的那个人不仅知道你们共同的命运,而且随时可能在有意无意间把那个答案透露给你,一个轻轻的点头或摇头足矣。
我从未遇到过这种情况,但我们不时会碰到像金这样的人。金的外祖母前不久因亨廷顿病去世了,因此他想检测一下自己是否也携带致病基因,但他的母亲不愿意这么做。即使金的检测结果是好的,我们对他母亲的情况也还是一无所知;但如果他被查出继承了这种缺陷基因,那么他母亲一定也是如此。最终,她决定尊重儿子的意愿。金的基因检测结果表明,他并不是那不幸的1/4(他母亲继承亨廷顿病缺陷基因的概率为1/2,而她又有1/2的概率将该基因遗传给儿子)。不过,金的母亲到底有没有携带亨廷顿病基因,仍是一个谜。
如果我们检测的对象是儿童呢?为人父母,自然会担心自己的孩子将来会不会患上亨廷顿病这样的可怕疾病,因而也迫切地想要知道答案—主要是希望听到好消息,以求得一个心安。但这种预测性基因检测一经问世,遗传学界就一致认为应拒绝孩子父母的这种请求。这一决定是综合多方面考虑做出的,包括对这种检测可能造成基因歧视和污名化的担忧,以及担心有基因缺陷的孩子可能会因此受到伤害,等等。对于我而言,我们之所以应对这种请求说“不”,最重要的原因在于,儿童也有选择权。如果我们遵从父母的意愿为孩子做基因检测,我们就剥夺了他们不接受检测的权利。要知道,在做与不做检测之间,大多数成年人都选择了后者。既然如此,我们早早地剥夺孩子选择的权利,对他们真的公平吗?
所有这些讨论也好,争论也罢,都基于一个残酷的现实:纵使科学家们为寻找亨廷顿病的治疗方法倾注了大量心血,这种病至今仍是无法攻克的医学难题。倘若有一种药物可以将亨廷顿病扼杀在摇篮里,而且为了保证药效的发挥,须从小就开始服用,我们此前设立的种种规则马上就要推倒重来。存在这样争议的疾病还有很多,家族性腺瘤性息肉病(familial adenomatous polyposis,FAP)就是一个典型的例子。这是一种以结肠多发性息肉为特征的常染色体显性遗传病。若置之不理,发展成结肠癌几乎不可避免。一旦结肠内出现息肉,就需要通过手术切除结肠。这种结肠息肉一般在15岁前后开始出现,但也不排除更早出现的可能。因此,有家族性腺瘤性息肉病家族史的人,在10至12岁左右就应开始做结肠镜筛查。
正因为如此,为有家族性腺瘤性息肉病风险的儿童做基因检测虽然非同小可,但完全无可非议。家族性腺瘤性息肉病和亨廷顿病有重要区别。首先,家族性腺瘤性息肉病的发病年龄通常要早得多,毕竟如果像亨廷顿病那样成人后才发病,我们一般不会提前数十年为一个儿童做基因检测。其次,面对亨廷顿病我们也许束手无策,但家族性腺瘤性息肉病不同,不管是肠镜筛查还是手术切除,起码我们能够做点什么,只不过这些检查或治疗手段可能没那么好受罢了。换个角度想想,这未尝不是我们应推广家族性腺瘤性息肉病基因检测的又一个理由—差不多一半的有患家族性腺瘤性息肉病风险的孩子可以因此免受肠镜、手术之苦。
在亨廷顿病和家族性腺瘤性息肉病这两个极端之间的是一组遗传性心脏疾病。心肌病(cardiomyopathy),顾名思义,是一种与心肌有关的疾病。其中,肥厚型心肌病(hypertrophic cardiomyopathy,HCM)是最常见的一种类型,它以心肌肥厚为特征,易引起左心室流出道血流受阻。扩张型心肌病(dilated cardiomyopathy,DCM)也很常见,主要表现为心室扩大,并伴有心室收缩功能减退。这两种心肌病都可能导致心电活动异常,进而引发致命的心律失常或心脏骤停。还有一些心脏病,如长QT综合征(long QT syndrome,LQTS),虽不伴有心肌病变,却也会导致心电活动异常。
上述几种心脏病主要为常染色体显性遗传,就像亨廷顿病与家族性腺瘤性息肉病那样,而且这些心脏病在一个家族之间以及不同家族之间的表现差异非常大。我曾碰到过一个14岁的男孩,他在放学回家的路上拐进了街边的一家快餐店,看上去和一般的孩子没什么不同。谁知,排队时他突发心脏骤停,倒地不起。但那个男孩是幸运的,因为说来也巧,那天排在他后面的女士是名护士。她见状立即为男孩做心肺复苏,一直做到救护车抵达。男孩最终被救了回来,没有留下任何后遗症,真是万幸。但医生检查发现那个男孩其实患有严重的心肌病,这正是让他心脏骤停的元凶。我们通过基因检测锁定了导致他患病的基因突变,并对他家族中的其他成员进行了筛查追踪。结果表明,该家族中好几个人的心脏都有问题,只不过病情相对较轻,男孩的母亲也不例外。更值得一提的是,男孩年逾古稀的外祖父,老人生来就携带了和外孙一样的基因突变,然而这么多年过去了,他的心脏依然无比健康。
至少对成年人来说,决定接受这类遗传病的基因检测,往往要比接受亨廷顿病检测容易得多。诚然,做出这样的决定也并不容易,尤其是当你检测发现自己有患上某种严重心脏病的风险时,你可能会万念俱灰。但这类疾病好就好在有药可医,有效的治疗手段可以极大地降低死亡的风险,而且如果足够幸运,你也许永远都不会出现症状。然而,我们依旧面临同样的问题:是否应该为这些家族中的孩子做基因检测,看看他们有没有继承某种心脏病的“风险基因”?即使他们真的携带了这种基因,这样的结果又意味着什么呢?毕竟,预测终归只是预测,而非预知。说不定,你就是那个被命运眷顾的幸运儿,得以带着“风险基因”健康地度过一生。另一方面,这些遗传性心脏病并非成年人的“专利”,很小的孩子患病的情况也时有发生。当然,你可以选择接受干预治疗降低患病风险,也可以通过基因检测以外的方式来筛查这类心脏疾病,比如超声心动图检查(echocardiography)就是个很好的选择。这类检查手段都属于非侵入性检测,成本也不算高。就算筛查发现了问题,到时候再接受针对性的治疗也来得及。
到底应不应该为儿童做遗传性心脏病基因检测?似乎没有人能给出一个确定的答案,遗传学家们意见不一。这些年来,我自己的立场也发生了转变。如今,我会先向那些想给孩子做基因检测的父母详细解释所有检测相关的事宜,确保他们充分了解基因检测结果可能带来的影响。如果他们听完后仍有检测的意愿,我就会遵从他们的意见给孩子安排检测。如果是大一点的孩子,我会让他们一同参与决策,听取他们的意见。青少年给出的答案往往是“不”。
此外,从基因检测的角度来说,心脏疾病与脑部疾病、癌症等相比,还有些特殊。一个人如果检测出可导致遗传性心脏病的突变基因,也许不会招致歧视和偏见,却可能面临其他一些困扰。比方说,你长大想当一名飞行员,但你有没有想过,如果体检医生得知你做过基因检测,且结果显示你有发生心脏骤停的风险,会做何感想?当然,你或许能够健健康康地过完自己的一生,永远不受心脏病的困扰,但不要忘了,航空业是个不能冒风险的行业,航空安全容不得半点马虎。如果这样的基因检测结果最终让你与梦想职业失之交臂,也完全不足为奇。
就亨廷顿病、家族性腺瘤性息肉病以及遗传性心脏病而言,所谓的不确定性在于到底要不要接受检测。有时候,不确定性源自检测结果,而非检测本身。
李安和德里克想要个孩子已经有很长一段时间了,他们做了一项又一项检查,却始终找不到不孕不育的原因,但有一个因素是肯定的,那便是年龄。在这一点上,他们从一开始就不占据任何优势。这对夫妇第一次去看医生的时候,李安37岁,德里克40岁。当我见到他们时,李安已经41岁了,在数年来的无数次体外受精(in vitro fertilization, IVF)均以失败告终后,她最终自然受孕了。他们告诉我,这个结果让他们欣喜不已,但又不由得担心孩子的染色体有什么问题。很快,李安的孕早期超声波检查显示,胎儿的颈后部有积液,提示胎儿的染色体可能存在异常。为进一步确诊,这对夫妇决定接受绒毛膜绒毛取样术(chorionic villus sampling, CVS)。这项检查须从胎盘中提取适量绒毛组织用于基因检测,其主要原理是胎盘与胎儿的染色体构成基本一致,因而如果胎儿染色体异常,这种异常也会反映在胎盘绒毛细胞中。
李安的绒毛膜绒毛取样术检测结果显示,她腹中的胎儿有45条染色体,而非正常的46条;23号染色体既不是XX也不是XY,而只有一条X染色体。正是因为这一结果才有了我和德里克夫妇的第一次会面,我需要和这对父母谈一谈这对他们的孩子意味着什么。
一般而言(当然有例外),如果你有两条X染色体,你会是一个女孩。如果你有一条X染色体和一条Y染色体,一般而言(当然也有例外)你会是个男孩。这就是为什么X染色体和Y染色体被称为“性染色体”。
其实,每一个胚胎在发育初期时都兼具发育成男性和女性的“潜能”。这是因为早期的两性胚胎都具有两套原始生殖管道,其一为沃尔夫氏管(the Wolffian duct),可发育形成男性生殖腺;另一个则为苗勒氏管(the Müllerian duct),可发育形成女性生殖腺。当胚胎发育到第6周左右的时候,如果SRY基因被激活,苗勒氏管就会逐渐退化,沃尔夫氏管则继续发育,是个男孩!SRY基因,顾名思义,位于Y染色体上。假如胚胎体内没有这一基因“发号施令”—例如,胚胎没有Y染色体的情况下—一组不同的信号就会发挥作用,“指挥”沃尔夫氏管退化,苗勒氏管继续发育,是个“小棉袄”!
当然,这是在正常情况下。
性别分化是一个复杂的个体发育过程,就像人体发育要经历的所有复杂过程一样,它也存在漏洞—不可避免地会出现一些错误。不管是男孩体内有两条X染色体,还是女孩有一条X染色体和一条Y染色体,所有这些性别分化过程中可能产生的错误都统称为性分化异常(disorders of sexual differentiation, DSD)。性分化异常患者往往无法生育,但有时他们还会出现其他并发症,这是因为性别分化过程涉及的部分基因不仅在性发育中扮演重要角色,对人体其他部位的发育也至关重要。比如,婴儿性分化异常可表现为出生时外生殖器性别区分模糊。这种情况下,如果你问助产士“这是男孩还是女孩”,“我不知道”大概是最贴切的答案了吧。
说来你可能不信,尽管性染色体的异常可能也的确会引发这样那样的问题(取决于X、Y染色体异常的具体情况),但其实这种异常几乎不会对生理性别的判定造成任何困扰。正如我在第一章中说的那样,你体内的所有染色体都确凿无疑有且仅有两条,多一条少一条都可能是致命的,唯独那对性染色体是个例外。
X染色体和Y染色体很特别,或者可以这么说,X染色体是独一无二的,而Y染色体只是跟着“沾了光”罢了。X染色体比Y染色体大,上面分布着多个重要基因,其中不乏大脑以及智力发育不可或缺的基因。相比之下,Y染色体上大多是无用的“垃圾”,要说它上面有什么基因,除了睾丸发育和精子产生所需的SRY基因,好像也没有什么了。
这着实令人费解。21号染色体比X染色体小得多,而且重要性远不及后者,但少一条都是致命的,照理说少一条X染色体更是如此,但为何大多数男性只有一条X染色体却仍安然无恙呢?话又说回来,既然男性正常情况下有且仅有一条X染色体,女性为何可以有两条X染色体?多的那条X染色体难道不会带来麻烦吗?
这一“X染色体之谜”的谜底由玛莉·莱昂最先提出。莱昂是一位小鼠遗传学家,于20世纪40年代获剑桥大学理学博士学位,师从英国著名统计学与遗传学家罗纳德·费希尔,专攻小鼠遗传图谱研究。在二战结束后的几年里,莱昂将研究重点转向了辐射影响下的小鼠染色体。在当时对“核武器应用可能对人类染色体产生影响”的隐忧不断加剧的大背景下,她的这项研究得到了英国医学研究理事会(the Medical Research Council, MRC)的资助。在1961年发表于《自然》杂志的一篇文章中,莱昂总结了自己此前的多个重要发现,包括带有X染色体相关突变的小鼠毛色特征,以及只有一条X染色体的雌性小鼠完全无异于正常的有两条X染色体的雌性小鼠这一事实。她由此推断,在胚胎发育早期,雌性哺乳动物细胞内的两条X染色体中的一条会发生失活,即这条染色体上的大部分基因都会“关闭”,而另一条X染色体则保持激活状态。如果一只雌性小鼠一条X染色体上的某个毛色基因发生了变异,也就是所谓的突变型基因,而其另一条X染色体上的等位基因是“正常的”,即野生型基因,你看到的就会是一只野生型与突变型毛色相间的“花鼠”。这是因为当毛根处色素生成细胞的野生型基因处于激活状态时,会产生一种特定颜色的毛,而如果突变型基因处于激活状态,所产生的毛就会是另一种不同的颜色。至今,研究人员已经在至少6个不同品种的小鼠中观察到了这种现象。
莱昂提出的这一推论便是著名的莱昂假说(the Lyon hypothesis),她描述的这个过程被命名为莱昂化(Lyonisation),只不过现在人们更通俗地称之为X染色体去活化或X染色体失活(X-inactivation, XCI)。事实证明,莱昂当时的推测无一例外都是正确的。她也认识到自己的这套基于小鼠遗传学的假说或许有助于破解人类“X染色体之谜”,但囿于当时人类X连锁遗传病还鲜为人知,她未能开展进一步的研究。如今,我们知道这样的遗传病有很多。这类疾病的特别之处在于,男性患者的病情往往十分严重,而女性患者可能根本没有症状,或者症状表现为色素性皮疹、斑块等皮肤改变。X连锁遗传病还有一种极端情况。
X染色体上有两个特殊区段,存在于这些区域的基因表达不受X染色体失活的影响,几乎都处于激活状态。相应的,在Y染色体的相同位置也有这样的两个同源区段。位于X染色体这两个区段上的基因,都可以在Y染色体的对应区段找到其等位基因。这就使得这两个特殊区域的基因,在遗传和表现模式上都与常染色体上的基因相同。这两个区域也因此得名拟常染色体区,或“伪常染色体区”(pseudoautosomal regions, PARs)。它们位于X、Y染色体的两端,对维持性染色体的结构和功能有重要意义。特别是在产生男性精子的减数分裂过程中,伪常染色体区的存在为确保X、Y染色体的正常分离和遗传重组发挥了关键作用。如前所述,伪常染色体区由两个部分构成,在性染色体上占的面积并不大,其中稍大一点的部分为PAR1,位于X、Y染色体短臂的末端,仅包含16个基因;稍小的那部分就是PAR2,位于X、Y染色体长臂的末端,其上的基因更少,只有3个。你可千万别小看这两个不起眼的区域。
设想一下,如果PAR1和PAR2只是性染色体两端无关紧要的存在,那你有多少条X染色体可能也无所谓了,反正X染色体去活化机制会把X染色体上PAR1/PAR2以外区段的基因统统“关闭”。同样的,即使你只有一条X染色体也不要紧。本来就没有多少基因的Y染色体估计就更不用提了,如果两端PAR1/PAR2上的基因可以忽略不计,就算你有多条Y染色体可能也无伤大雅。
事实并非如此。女性如果多了一条X染色体,就相当于有44条常染色体加上3条X染色体,共47条染色体。这类女性除了身高较高以外,几乎与健康人无异。你完全可能一生都与这三条X染色体为伴却全然不自知,或者说也没必要知道。另一方面,目前可以肯定的一点是,相较于只有两条X染色体的正常女性,体内有三条X染色体的女性往往更容易出现学习障碍,而且在儿童时期可能表现出行为问题,重者甚至会患上自闭症。男性多了一条Y染色体(即染色体核型为47,XYY)的情况与之相似:他们大多过着完全正常的生活,根本不会察觉自己的性染色体有何异样。但如果男性多的是一条X染色体(47,XXY),情况又有所不同。这是一种叫克莱恩费尔特综合征(Klinefelter syndrome)的遗传病,也称先天性曲细精管发育不全症,患者无法分泌足量的睾酮,更容易出现学习或语言功能障碍,且大多无法生育,其中部分症状可通过补充睾酮得到改善。如果我们继续做加法,将多余X染色体的数量增至2条(48,XXXY)或3条(49,XXXXY),其结果估计你也猜到了:情况只会越来越糟。
自上述这些疾病首次被描述以来,几十年过去了,我们对它们的认识仍不甚充分。究其原因,主要与性染色体异常疾病本身的特点有关。这类疾病往往呈现出明显的两极分化现象,轻者几乎没有症状,重者症状多种多样,而这会直接影响医生真正接触的患者类型。试想一下,如果你是患者,但完全与常人无异,可能连你自己都察觉不到,谁又会去数你到底有几条性染色体呢?也就是说,那些真正去医院做染色体检查的人,并不能代表整个患有这类疾病的群体—他们往往更偏向于症状比较严重的那类。这就是所谓的确认偏差(ascertainment bias),也是困扰所有研究症状呈现两极分化疾病的研究人员的一大难题。
20世纪六七十年代,曾有多项关于囚犯的研究“表明”,性染色体为XYY的男性被监禁的可能性更高。此后数十年间,研究人员始终认为正是那条多余的Y染色体让这些男性变得更富攻击性,从而更容易犯罪入狱。但是,关于这一现象的讨论并没有就此停止。2006年,丹麦研究人员公布的一项研究报告又让这一问题重回公众视野。基于1978年至2006年间对丹麦患有性染色体异常(47,XXY和47,XYY)的15—70岁男性犯罪记录的追踪数据,他们得出了以下结论:同等条件下,这类男性的犯罪率较一般人群更高,但如果将贫困等社会经济因素考虑在内,这种差异就没有那么明显了。现在看来,该研究的对象都是已经确诊带有3条性染色体的男性,而他们能够接受检查想必也是有原因的,因此并不具有代表性。在考虑贫困等因素的条件下,他们仍然得出“性染色体为XXY和XYY的男性犯罪概率更高”的结论,其背后的原因,很可能也是确认偏差在作祟。
诸如此类的研究还有很多。例如,以婴儿为研究对象,通过大规模的染色体筛查筛选出性染色体异常增多的婴儿进行长期追踪调查—这实在不易,你只能把一切交给时间,让时间印证一切。除此之外,别无他法。正如你想的那样,此类研究的一个弊端在于,研究对象很早就筛查出了性染色体异常,因而他们的病情往往比那些出现明显症状后才诊断出异常的人群要轻得多。
关于多了一条性染色体可能产生的影响就说这么多,我们再说说如果少一条性染色体会怎样。李安和德里克的孩子就属于这种情况。总的来说,与染色体增多相比,染色体的缺失带来的后果更为严重,而这种少一条X染色体的情况也不例外。一般认为,这种只有一条X染色体的胎儿99%都会自然流产,而且往往是在母亲还没有发觉怀孕的时候。即使她们平安度过了孕早期,一个新的问题又会接踵而至:她们的颈部等身体多个部位会产生积液或水肿,而这又增加了胎儿流产的风险。那些为数不多的存活下来的女婴,一出生就患有一种叫特纳综合征(Turner syndrome)的疾病。这种病的临床表现差异很大,我们唯一能够确定的是患者通常身材矮小,且大多无法生育,仅此而已。
特纳综合征到底多么变幻莫测呢?这么说吧,患这种病的女孩可能还患有先天性心脏病和肾脏畸形。她的肩膀和脖子两侧部位可能变厚,呈现蹼状,且还带有典型的面部特征。此外,当她再大一点,上学对她来说可能又是极大的挑战。她的智力一般没有问题,但在一些特定方面会屡屡碰壁,需要借助他人的帮助才能克服。不仅如此,她的性格可能也会受到影响,变得害羞、焦躁、寡言少语。制订计划和做出决策对她而言可能尤为困难。
你以为这就结束了吗?非也。上面说的是最糟糕的情况,有的孩子可能只会表现出其中的几种症状,而有的可能除了个子矮点外和正常孩子没什么两样。她也许就这样无忧无虑地长大了,直到有一天,她发现自己无法生育,一查才得知自己体内少了一条X染色体。
那天见到李安和德里克的时候,我向他们解释了我所知道的关于特纳综合征的一切,包括这种病会有哪些症状,各种症状发生的概率又如何,以及由于这种疾病的特殊性,我们所掌握的统计数据可能失之偏颇等。现阶段我能给他们的唯一安慰是,根据李安的超声结果,胎儿的心脏和肾脏应该都是正常的。作为医生,我所能告诉他们的只有这些,除此之外,一切都是未知的。等待他们的是什么?也许只有时间才知道答案。
面对这样的不确定性,该何去何从?对于李安和德里克而言,做出这一选择相对简单。他们告诉我,假如孩子有致命的缺陷,他们会毫不犹豫地选择终止妊娠;如果孩子患的是唐氏综合征这样的遗传病,他们可能一时很难选择。但他们的孩子患的是特纳综合征,纵使考虑了最坏的可能,在他们看来这似乎仍是不幸中的万幸。诚然,为人父母,一想到自己的女儿将来要面临那么多的考验,他们心如刀绞,而女儿今后很可能无法生育的事实,对初为人母的李安而言更如晴天霹雳。不管怎样,他们还是想留下这个来之不易的孩子。
面临类似选择的父母我见过很多,但像李安和德里克那样当机立断的寥寥无几。听闻孩子患有特纳综合征或克莱恩费尔特综合征的消息,很多夫妇都难以接受、无所适从,一番激烈的心理斗争过后,他们大多数人的选择都是终止妊娠。哪怕孩子的性染色体是XXX或XYY,很多父母还是会做出同样的选择。
这样的选择本身不难,难的是选择背后的不确定性。
人生又何尝不是由无数这样的选择串联起来的呢?终其一生,我们都在选择—关于人、关于教育、关于未来。孰对孰错,何去何从?谁也无法告诉我们答案。这样的选择到底有多难,从市面上关于应对不确定性的励志书籍受欢迎程度就可见一斑。诚然,每一对准父母都会面临这样那样的不确定性:还未见面的孩子会是什么样子?自己又能否扮演好父母的角色?他们期待着而又忐忑着。对一些准父母而言,不确定性,还意味着关乎生命的选择。在生与死之间选择已异常艰难,而在极其有限的时间内做出选择更是难上加难。孩子的检查结果一出,就等同于按下了倒计时,若父母不能尽快选择,将永远失去选择的机会。
临床遗传学是与不确定性的角力,而这种不确定性又多种多样。我们见过太多的“杰森”,答案就在那里,关键就看能不能鼓起勇气迈出那决定性的一步;我们也见过太多的“李安和德里克”,纵使已经勇敢地迈出了那一步,到头来却发现自己面对的仍是未知。现在,一种新的不确定性似乎又悄然降临了。很多时候,我们做了一个检测,却发现我们根本无法确定这个结果到底有没有意义。
 
 
 

第五章  大海捞针

众所周知,这世上有已知的已知,也就是那些我们意识到我们知道的事物;还有已知的未知,即我们知道有些东西我们还不知道;殊不知,这世上还有未知的未知—有些事,我们不知道自己不知道。
—唐纳德·拉姆斯菲尔德
 
 
唐纳德·拉姆斯菲尔德当年的这番言论招致了不少冷嘲热讽,但我始终觉得他说的也并非毫无道理,抛开政治立场等因素不谈,这段话的确道出了世界的真谛。世界之大,充满了未知,而驱使我们不断前进的,不是已知的世界,而是那更广阔的未知世界。世界如此,医学亦如是。在我看来,拉姆斯菲尔德最后提到的“未知的未知”还可以进一步细分为两类:我们完全闻所未闻的事物,和我们以为自己知道但其实不然的事物。医学的世界里,这样的“未知的未知”到底还有多少呢?每每想到这儿,我就彻夜难眠。
2011年对我来说是特别的一年,不知不觉间,临床遗传学家这一身份已陪伴我走过了十余载。那年的某一天,我和迈克尔·巴克利(Michael Buckley)像往常一样闲聊,他是我的良师,也是益友。我怎么也没有想到,那次再平常不过的闲聊,竟会成为我职业生涯的重要转折点。迈克尔是澳大利亚最顶尖的遗传病理学家之一。他的实验室,也就是我现在工作的地方,是澳大利亚重要的罕见遗传病诊断中心。记得那天聊着聊着,我提到有时很希望自己也是一名遗传病理学家,迈克尔听罢,笑着对我说现在成为一名遗传病理学家也未尝不可。说者无心,听者有意,是啊,未尝不可!这句朋友间的玩笑话一下子将我点醒,我与遗传病理学的故事就这样开始了。但要成为一名合格的遗传病理学家绝不只是说说而已,此后数年间,我一边接受检验医学专业培训,一边兼顾本职工作,同时还参加了大大小小的考试,只为早日实现这一目标。现在,我既是一名临床遗传学家,也是一名遗传病理学家,每日往返于医院和实验室之间,一边为我的病人安排基因检测,一边还要为外院送检样本撰写检测报告。
我与遗传病理学结缘实属偶然,却可谓恰逢其时。在我刚开始接受专业培训的时候,一种全新的基因检测技术就已经在酝酿之中。接下来的几年里,这一愿景终于成了现实,遗传病理学步入了全新的时代。能够成为这场变革的亲历者和见证者,我何其有幸。
你应该还记得人类全基因组测序成本的大幅下降吧?当年需要耗费数十亿美元的全基因组测序,如今只需要不到1 000美元。从遥不可及到触手可及,全基因组测序究竟经历了什么?詹姆斯·沃森和克雷格·文特尔是最早的两位接受全基因组测序的人。第三位则是一位名叫丹·斯多埃塞斯库(Dan Stoicescu)的瑞士富商。医药化学博士出身的斯多埃塞斯库创办自己的生物技术公司取得了巨大成功,相比于把挣来的钱花在购买豪车或私人飞机上,他选择了测序自己的全基因组。为斯多埃塞斯库测序的是美国生物技术公司Knome,当时这项服务的报价是35万美元。这在当时看来性价比极高,毕竟就在前一年,测序沃森基因组所花费的成本几乎是它的三倍。不想到了第二年,Knome这项全基因组测序服务的价格就跌到了10万美元。这也就意味着,在那段时间购买基因检测服务要有极大的勇气或完全不在乎钱的心态才行。
相较于全基因组测序,Knome公司的外显子组测序服务可能没有那么引人注目,但论重要性,它其实更胜一筹。外显子是真核生物基因组中参与编码蛋白质的片段,基因组中全部外显子的总和即为外显子组(exome)。在人类基因组中,外显子组序列仅占1%—2%,因而与需要读取全部序列的全基因组测序相比,外显子组测序的成本要低得多。此外,鉴于目前已知的大部分致病突变都集中在外显子组中,只对外显子组进行测序也可以达到诊断疾病的目的。
2009年10月5日,一位叫丹尼尔·麦克阿瑟(Daniel MacArthur)的美国科学家在《连线》(WIRED)杂志上发表了一篇关于Knome推出价格24 500美元的个人外显子组测序服务的文章。仅仅5年后,麦克阿瑟就以其主导的人类外显子组整合数据库(the Exome Aggregation Consortium, ExAC)项目在遗传学界名声大噪。人类外显子组整合数据库收集了超过6万人的外显子组数据,两年后的2016年,人类外显子组整合数据库的升级版—基因组整合数据库(Gnome Aggregation Database, gnomAD)问世,它整合了超过125 000份人类外显子组数据和15 000份全基因组数据并面向全世界免费开放,可以说是解读基因检测结果最不可或缺的一大工具。
回望2009年,外显子组测序的临床应用似乎遥不可及。它高昂的价格让一般人望而却步,因而仍是富人和极少数资金雄厚的研究实验室的专利。即使随着时间的推移,人们意识到这种测序方法应用于临床诊断只是时间早晚的问题,但到底还要等多久还很难说。
今天,外显子组测序已不再是遥不可及的梦想,技术进步是最大的“幕后功臣”。这要从人类基因组计划说起,当年该计划所使用的是第一代测序技术—桑格法测序,这种方法须先将待测序的DNA片段进行扩增,再通过一系列测序反应得到可以读取的短小DNA片段,通常一次可以读取几百个碱基。如果你的测序量不是很大,桑格测序法不失为一种很有效的测序方法。一般情况下,一个基因大约包含10—20个外显子。如果用这种方法进行外显子组测序,你需要将这10—20条DNA片段进行扩增、测序,再将测得的序列与已知基因组序列进行比对,工作量很大,但不是不可以完成。这有点像给了你一本体量浩大的书,但只要求你校对各章节的标题。你甚至可以用这种方法对整个基因组进行测序(即校对整本书),毕竟人类基因组计划最早采用的就是这种测序方法,但这是一项耗资数十亿美元、历时数年的浩大工程,哪怕在今天也是如此。且不说用第一代测序技术测序整个人类基因组,即使测序一个人的外显子组都是令人望而生畏的挑战—你要扩增、测序并读取30万条DNA片段。
由此可以看出,如果想让这种大规模测序真正变得触手可及,须另辟蹊径。目前,至少有六种技术可以实现大规模测序,其原理都是化学反应。尽管不同技术所利用的化学反应不尽相同,但它们的核心是一样的:一次读取尽可能多的DNA片段。这类测序技术被称为大规模平行测序(massively parallel sequencing, MPS),又称下一代测序(next-generation sequencing , NGS)、第二代测序。开创这一代测序技术先河的是现已不复存在的454生命科学公司(454 Life Science,以下简称454公司)。这个名字的由来是个谜,有传言称该公司最初所在的街道号是454号,还有一种说法提到454华氏度是金钱燃烧的温度。
言归正传,454公司的创立者是乔纳森·罗斯伯格(Jonathan Rothberg),生物科技领域的史蒂夫·乔布斯。1993年,还是一名学生的罗斯伯格创办了他的第一家基因组公司CuraGen,也就是454公司的母公司。其后,他又创立了多家基因科技公司,其中最有影响力的两家当数RainDance(这个名字起得好多了)和Ion Torrent。
罗斯伯格步履不停,加速基因测序技术创新的背后,是一个父亲对孩子深沉的爱。他的大女儿患有一种罕见遗传病,二儿子诺亚在出生后不久就出现了呼吸困难的症状,他的医生却找不到原因。尽管后来孩子没有大碍,但这件事一直让罗斯伯格耿耿于怀:如果儿子的医生当时能做快速基因检测,就能在第一时间判断像他儿子这样的孩子是否患有遗传病了。从那时起,探寻快速基因检测的方法就成了罗斯伯格的心愿。他也确实实现了这一目标—我工作的实验室里就有一台Ion Torrent研发的Ion Proton测序仪,可以通过快速外显子组测序诊断婴儿是否患有遗传疾病。
在其他更先进、更快速及更便宜的测序仪问世之前,454公司的产品一直是新一代基因测序技术的领军者。詹姆斯·沃森的基因组测序就是由该公司完成的。此外,进化遗传学家斯万特·帕博绘制出第一份尼安德特人(Neanderthal)基因组草图,用的也是454公司的测序仪。这份基因组草图表明,在某种程度上,尼安德特人并没有完全灭绝—由于杂交繁殖,大多数人类都或多或少带有尼安德特血统,约五分之一的尼安德特人基因组在现代人的基因组中“存活”了下来。
要对尼安德特人的基因组进行测序并不容易,因为可供检测的DNA十分有限—经过数万年历史残存的少量珍贵DNA。此外,这些DNA样本已经支离破碎且已发生降解,极少量现代人的DNA都可能对其造成污染。要对这样的基因组进行测序,其难度可想而知。
说到这里,就不得不提到现代遗传学最伟大的无名英雄之一—没错,我所说的正是NA12878。它听上去可能不像个人名,但在检验遗传学领域却无人不知、无人不晓。它确实不是一个真正意义上的“人”,而是一个“瓶子里的基因组”。事实上,这样的“瓶子里的基因组”有很多,NA12878只是其中之一,但它无疑最有名且使用最广泛。这瓶基因组的主人是1980年生活在美国犹他州的一位女性。关于她,我们知道的并不多,只知道那时她的父母都还健在,以及她是11个孩子的母亲(6个儿子和5个女儿)。她和父母同意将他们的DNA广泛应用于科学研究,也同意研究人员采集和使用她孩子们的DNA(至于他们当时是否到了可以自己做决定的年龄,我们尚不清楚)。研究人员在实验室中培养了一些从她身上采集的细胞,以此得到了“取之不尽、用之不竭”的细胞,并从中提取了大量DNA。
研究人员对这些DNA样本进行了一遍又一遍的测序,可以说,我们所了解的关于一个人基因组的一切都源自NA12878。就这样,它成了遗传学的黄金标准。正如世界上所有的“千克”和“米”,最早都以密封存放于法国巴黎国际计量局总部的国际千克原器和国际米原器为基准那样,几乎世界上所有的基因组实验室都以这位女性的基因组作为参考标准。你可以购买成管的NA12878DNA样本(所谓“瓶子里的基因组”就是这么来的),作为标准参照物。以我们实验室为例,我们每月都会对她的外显子组进行两次测序,作为评估测序质量的标准,以保证我们测序的高准确性。之所以选择以NA12878为样本进行测序,是因为我们对其基因组的每一个区域都了如指掌,一旦测得的结果与已知序列有任何出入,我们就知道一定是测序出了差错。如果说沃森、文特尔和斯多埃塞斯库分别是全世界第一、第二和第三位完成基因组测序的人,那NA12878样本的主人无疑是世界上被测序次数最多的人,在这一点上,她以极大的优势获胜。一个人,一个决定,一管血液样本,40年过去了,NA12878,每每有人提起她的“名字”,我都会想她是否还在。如果她还健在,她又是否知道,自己40年前的一个无私之举,改变了多少人的命运?
过去十年间,新一代测序技术已从科幻小说中才有的高科技变成触手可及的现实,如今又步入了临床时代,其对遗传学的影响无疑是颠覆性的—能亲眼见证这一切的喜悦之情无以言表。当我还只是一名临床医生的时候,我见过太多患有智力障碍或其他复杂并发症的孩子,尽管我们怀疑这可能是由遗传导致的,但囿于当时有限的检测手段,我们很难做出准确诊断。偶尔运气好的话,我们能根据孩子表现出的症状做出诊断。但大多数情况下,他们的症状并不典型,我们只能把能做的检查都做一遍,绞尽脑汁把各种可能的病因都想一遍,如果还找不出病因,我们还会查询各大数据库,甚至求助于“畸形学俱乐部”(详见第七章)……但即便是这样,我们仍然一无所获。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 全屏 打印 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多