历史总是充满了巧合。
1953年4月25日,英国卡文迪什实验室的克里克(F.H.C. Crick)与来自美国的沃森(J.D.Watson)共同在《自然》杂志上发表了题为《DNA分子结构——一种可能的结构》的论文,指出DNA具有双螺旋结构和自我复制机制。1957年,克里克又提出了著名的“中心法则”,解决了DNA如何复制与传递遗传信息的难题。
DNA双螺旋结构的理论有着划时代的意义,是20世纪最伟大的科学成果之一。在此基础上,科学家们成功地研究出了基因疗法、转基因作物、生物克隆技术和DNA鉴定技术,因而克里克和沃森被生物学界一致誉为20世纪最有影响的科学家。
无独有偶,同样是4月25日(2014年),美国《科学》杂志报道了中科院生物物理所一项关于30纳米染色质高级结构解析的研究成果,标志着一个尘封30多年的谜题被解开了。
此前,科学家们已经知道,遗传信息DNA是经过凝缩之后聚集在只有几个微米的细胞核里的,其核小体以密集堆积的方式形成了一种直径为30纳米左右的管状螺旋体,即30纳米染色质纤维。一个细胞中的DNA加起来有2米长,这么长的DNA怎样组装成仅有几微米大小的细胞核?30多年来一直是现代分子生物学领域的困扰。
每个细胞都是从单个受精卵细胞发育分化而来,具有相同的遗传信息。然而,人体却有着200多种不同的细胞,虽然它们具有相同的遗传信息,但是它们的形态和生理功能却大相径庭。2009年,西班牙和美国科学家分析了一对同卵双胞胎的全基因组,发现其中一个人的基因正常,另一个人却患有一种与遗传有关的疾病——红斑狼疮。这一结果意味着,虽然DNA被人们称为遗传信息的载体,但DNA在生命体内并不是独立存在的,任何遗传信息的传递和调控等生命活动都是在DNA与其缠绕的蛋白质所形成的染色质这个“生命信息载体”上进行的。
经过多年来的研究,普遍认为生命体通过调控细胞核内染色质结构(特别是30纳米染色质高级结构)的动态变化来有选择地进行基因的激活和沉默,从而控制细胞自我维持或定向分化,决定细胞的组织特异性和细胞命运,进而形成复杂的组织、器官和个体。所以有专家表示,研究染色质的高级结构及其调控机制,对于理解细胞增殖、发育及分化过程中一些重要基因的表达差异及表观遗传学调控机理具有重大意义。
然而,染色质的高级结构变化却像一个“黑箱子”,科学界对此一直没有搞清楚。当科研究人员遭遇一些不能解释的现象时,只好懵懵糊糊归结为“该因子以某种方式改变了染色质的高级结构”。因此,30纳米染色质结构一直是染色质和表观遗传学领域的“老大难”问题。中科院生物物理所研究员李国红表示,结构都未被解析,表观遗传信息对其结构乃至更高级染色质结构的影响是无从谈起的。只有啃下这块“硬骨头”,人类在认识自己的道路上才能走得更远。
在结构生物学中,采用X射线晶体、核磁共振等方法,面对30纳米染色质纤维这样一个超大分子复合体都显得无能为力。生物物理所研究员朱平专长冷冻电镜三维结构研究,他与长期从事30纳米染色质及表观遗传调控研究的李国红协同配合,各自发挥优势,共同搭建了一套染色质体外重建和结构分析平台,为应用新的研究手段——冷冻电镜铺平了道路。
制备样品是另一大难题。在人体内,任何环境细微的变化都会引起30纳米染色质的很大变化,在体外环境下就更难得到高度均一的样品。为此,李国红设计了一种体外自组装方法,精确控制实验环境,使其尽可能与体内环境接近,最终成功制备出合格的样品。
终于,中国研究团队在国际上率先解析了30纳米染色质的高清晰三维结构:30纳米染色质纤维以4个核小体为结构单元,各单元之间通过相互扭曲折叠形成一个左手双螺旋的高级结构。与此同时,还明确了组蛋白H1在30纳米染色质纤维形成过程中的重要作用。这是一项可以写进教科书的成果,因为在现代生物学教科书中,30纳米染色质纤维一直被描述为由6个核小体组成的中空螺线管。
附:1953年沃森和克里克发现DNA双螺旋结构的论文:

我们拟提出脱氧核糖核酸(DNA)盐的一种结构。这种结构的崭新特点具有重要的生物学意义。
鲍林和考瑞曾提出过一个核酸结构。他们在发表这一结构之前,欣然将手稿送给我们一阅。他们的模型包含磷酸接近纤维轴,碱基在外周的三条多核苷酸链。我们觉得这样的结构是不够满意的,其理由有二:
(1).我们认为进行过X射线衍射分析的样品是DNA的盐而不是游离的酸。没有酸性氢原子,接近轴心并带负电的磷酸会相互排斥。在这样的条件下,究竟是什么力量把这种结构维系在一起,尚不清楚。
(2).范德瓦尔力矩似显太小。弗雷泽曾提出过另外一种三条多核苷酸链的结构(将出版)。在他的模型中,磷酸在外边,碱基在内部,并由氢键维系着。他描述的这种结构也不够完善,因此,我们将不予评论。
我们拟提出一个完全不同的脱氧核糖核酸盐的结构。该结构具有绕同一轴心旋转的两条螺旋链(见图)。根据化学常识我们假定,每条链包括联结β-D-脱氧呋喃核糖的3′、5′磷酸二酯键。两条链(不是它们的碱基)与纤维轴旋转对称垂直,并呈右手螺旋。由于旋转对称性,两条链的原子顺序方向相反。每条链都与弗尔伯格的第一号模型粗略地相似,即碱基在螺旋内部,磷酸在外边。
糖的构型及其附近的原子与弗尔伯格“标准构型”相似,即糖和与其相联的碱基大致相垂直。每条链在z向每隔3.4埃有一个核苷酸。我们假定,同一条链中相邻核苷酸之间呈36度角,因此,一条链每10个核苷酸,即34埃出现一次螺旋重复。磷原子与纤维轴之间的距离为10埃。因为磷酸基团在螺旋的外部,正离子则易于接近它们。
这个结构模型仍然有值得商榷之处,其含水量偏高,在含水量偏低的情况下,碱基倾斜,DNA的结构会更加紧凑些。这个结构的一个新特点就是通过嘌呤和嘧啶碱基将两条链联系在一起。碱基平面与纤维轴垂直。一条链的碱基与另一条链的碱基通过氢键联系起来形成碱基对。两条链肩并肩地沿共同的“之”向联系在一起。为了形成氢键,碱基对中必须一个是嘌呤,另一个是嘧啶。在碱基上形成氢键的位置为嘌呤的1位对嘧啶的1位,嘌呤的6位对嘧啶的6位。
假定核酸结构中碱基仅以通常的互变异构形成(即酮式而非醇式构型)出现,则只能形成专一的碱基对。这些专一碱基对为:腺嘌呤(嘌呤)和胸腺嘧啶(嘧啶),鸟嘌呤(嘌呤)和胞嘧啶(嘧啶)。
换言之。按照这种假设,如果一个碱基对中有一个腺嘌呤,在另一条链上则必然是胸腺嘧啶。同样地,一条链上是鸟嘌呤,另一条链上必是胞嘧啶。多核苷酸链的碱基顺序不受任何限制。因此,如果仅仅存在专一碱基对的话,那么,知道了一条链的碱基顺序,则另一条链的碱基顺序自然也就决定了。