分享

所有人的线粒体基因都一样吗?不!但亲妈生的就可能一样

 林小霖 2020-02-01

前两天在悟空问答看到了一个问题:“所有人的线粒体基因都一样吗?”,答到一半悟空程序故障,导致文字丢失,问题也找不到踪影,查阅的资料和图片等等就用不上了。觉得可惜,于是写成这篇文章,科普一下线粒体DNA的相关知识。

首先需要先科普一下

基因

DNA

的概念区别差异

DNA是脱氧核糖核酸的缩写,是一种链状的有机分子,算是一种聚合物。聚合物的意思就是以某种小分子作为单位重复相连串起来的分子构成的物质。不同长度的聚合物分子都可以称为这种小分子单位的聚合物。而DNA就是由四种核苷酸分子聚合而成的双链高分子,DNA可以有各种长度,我们用碱基对(Kilo base pair)作为衡量DNA长度的单位,这与我们用字节数(Kilobyte)来衡量电脑文件的长度非常类似,两个单位缩写都是Kb。

基因是DNA上的小分子单位,是指DNA上一连串碱基对排列所存储的信息,这可以类比我们存放在电脑文件中的程序代码。基因在DNA上并不是紧密排列的,中间会有大量的非基因信息。通常我们只把用于编码蛋白质和RNA的DNA片段称为基因。其他部分则称为非编码区。非编码区的具体功能尚不清楚,目前认为有一些调节基因编码的功能,还有一些则是完全无用的遗传垃圾,例如病毒插入的DNA序列只是被静默了,不发挥效果。

染色体、DNA、基因、碱基概念的区别和联系

也就是说:一段DNA上不都是基因,只有部分具有编码蛋白质和编码RNA功能的区段才叫基因。

人类线粒体基因的相似性会高于线粒体DNA的相似性,因为某些突变差异可能并不发生在基因区段内。

线粒体DNA

线粒体DNA核DNA,不一样,它是环形的。毕竟DNA是一种长链状的线形分子,如果分子不是很长,那么首尾连接在一起就能构成环形。环形DNA是细菌等原核生物体内最常见的DNA形式。这个情况似乎暗示了线粒体似乎是被真核细胞“兼并”的某种原核生物(或者就是细菌),这就是著名的“内共生假说”的。

内共生假说认为线粒体(还有植物的叶绿体)都是某种寄生在真核生物体内的原核生物(通俗地说就是细菌),但随着演化,最后这种细菌不再能够独立生存,并且随着真核生物细胞的繁殖而繁殖,因此最终合并成为了一个物种。但实际上,即便是发展到人类这种高级的多细胞生物的程度,线粒体的遗传物质的复制和遗传仍然是独立进行进行的。我们体内的线粒体DNA是通过卵细胞的细胞质,而不是细胞核遗传下来的,并且在我们的身体的细胞的每一次分裂当中都会均分到新细胞当中。线粒体的复制(或者说繁殖)也是独立进行的,并不一定与细胞的分裂同时进行。这的确有点像是寄生的某种生物在我们的细胞里面不断地繁殖,只是这种寄生生物没办法离开我们,而我们也没办法离开它们。

线粒体DNA(右下角环形)

线粒体有别于细胞核的独立遗传路径,似乎暗示了真核生物的繁殖和遗传实际上是两条同时进行的道路。一条是核DNA的复制遗传路径,而另一条则是线粒体(还有植物的叶绿体)的复制遗传路径。这是高等真核生物繁殖的基本模式。

但线粒体DNA内并不包含复制线粒体的全部信息,也就是说线粒体的复制和增值依赖于细胞核。这就好像细胞核控制着线粒体的复制,或许这个情况也是生物进化过程中形成的一种制约关系,这使得我们不再是“宿主”,而是“一个细胞整体”。

线粒体DNA有多少基因?

人类线粒体只有37个基因,全部是编码参与磷酸氧化过程的蛋白质和RNA的。下面是线粒体基因的全表以及这些基因在线粒体DNA上的位置。这些基因之间填充了一些非基因的DNA序列。(非基因并不代表不重要。)

线粒体DNA的两条互补链分为轻链重链,两串相互耦合的DNA,以环状的方式首尾相接构成。下图中有颜色的部分才是有效的编码部分。

DNA的两条链是互补的(正链反链),但往往用于编码蛋白或RNA的时候只使用其中特定的一条,而另一条只作为互补的配对链,不会被用于实际的蛋白质或RNA的转录编码。但实际上双链都存储着相同的遗传信息,但某些生化过程偏好于采用正链的某个区段,而另一些则偏好采用反链的。

线粒体DNA也是一个环状的DNA双链,所谓重链,指的是在DNA双链中有一条被用于蛋白质和RNA构建的区域多于其反链。

从下图中,有颜色的环带指的就是由转录活性的基因区域。我们可以看到,在线粒体上,大部分基因的转录工作都集中在重链(外圈)上,而内圈(轻链)则只有少数区域有活性。请注意:实际上DNA的两条链是螺旋状纠结在一起的,因此并不分内外,这里只是图示。

线粒体DNA的基因分布

哪些人的线粒体DNA可以相同?

绝大多数人的线粒体DNA都不相同,一般只有同母系的亲属线粒体的DNA可能相同。也就是说母亲、外婆、姨婆、姊妹、儿子、女儿、外孙女……类推。DNA的结构比细胞核里面染色体上的DNA更为稳定,变异较少,而且因为遗传物质少(人类线粒体DNA只有16569对碱基),通常有可能在代际传播的时候整个DNA并没有发生任何变异,这是有可能的。所以母系亲属之间可能拥有完全相同的线粒体DNA的几率是比较大的。但线粒体DNA的复制,主要是卵子内线粒体DNA的复制,是贡献突变的主要因素。

但线粒体的突变速率是非常低的,根据科学家们推算,大概是每年每个位点只发生2.14~2.74 × 10^−8次替换突变(不是删除或插入),也就是说人类线粒体DNA全部序列都发生一次替换突变最短也需要0.467~0.37亿年的时间——这是在每个位点碰巧轮流发生替换突变,不会重复突变的最极端假设基础上估算的。如果以自然突变的概率,恐怕就要数十亿年都不一定能够全换一次。所以母系亲属之间线粒体可能完全相同(不存在任何突变差异)的概率比较大。

线粒体DNA母系遗传树示意

简而言之,从研究结论而言,线粒体DNA相同的一个重要条件通俗的说就是“一定要是亲妈生的”,不管你是男是女,只要是亲妈生的,就可以并且很容易跟亲妈的线粒体DNA相同,但不一定总是完全相同,因为万一你亲妈的线粒体遗传给你的时候(也就是变成你那个卵子)的线粒体DNA发生了突变,你就跟你妈不同了——这个足够通俗了吗?因此,你妈妈是你外婆亲生的,你又是你妈的亲儿子或亲女儿,那你和你妈的线粒体DNA可能最接近(甚至完全一样)。外婆和你亲妈的兄弟姊妹的线粒体DNA与你是亲妈之外最接近的(请再刷一遍上面的图)。

线粒体基本上跟爸爸那边没关系,虽然有最新研究发现个别情况父亲精子线粒体可能混入卵子遗传下去,但往往会导致遗传疾病,估计影响不大。

线粒体全部37个基因相同的人就要略多一点

因为线粒体基因并不是线粒体DNA的全部,而只是部分区段,虽然占据了线粒体DNA的大部分区段,但还是有些部分不是基因。而且往往基因突变会带来线粒体功能的改变,那些出现于基因内部的有害突变可能会导致后代生存优势下降,因此无数有害的基因突变可能会无法遗传下去从而从人类的线粒体基因库中被删除;相对的,如果有益的突变则会提高后代生存优势,被广泛遗传下去。但如果突变出现在一些无关紧要的非基因区段,那么情况就大大不同了。这些区段的突变并不影响后代的生存,因此可以广泛地遗传下去。所以基因突变被遗传下来的情况会更少。

小结一下即,如果突变发生在这些非基因区域内,那么就不影响基因的比较,所以母系远亲发生线粒体基因完全相同(但线粒体DNA不完全相同的)的情况的几率还是比较大的。

线粒体的复制过程跟细菌很类似

但是请注意,往往DNA的微小复制错误是非常常见的,线粒体在细胞内也会不断地复制再生,这个过程可能比细胞本身的复制还再生的频率还要高,因此发生错误的情况也会很多。但线粒体因为是环状DNA,其稳定性比线状的核DNA要高,因此从研究结果来看,线粒体DNA的变化相对于核DNA程度要轻很多,这种“保守性”使得根据线粒体DNA来研究人类遗传祖源似乎更可靠。也使得线粒体的代际遗传更稳定,大规模突变的情况是非常罕见的。毕竟线粒体DNA记录着生命体最关键的生化过程的信息,这部分信息对个体的生存是至关重要的,因此多数突变往往会导致生存优势下降而被排除出主流(野生型)基因库。

野生型,是指自然生存状态下的典型遗传类型。不是病理个案或者实验室培养或分离出来的特定突变个体或者群体。

世界人类线粒体DNA单倍体群分型

单倍体群是指DNA上特定的一个或多个位点遗传信息完全一致的所有生物个体的集合。也就是说用某一个位点或者多个位点把生物群体筛选了一遍,然后给这个群体一个代号或者名字,称为“xxx单倍群”。

因为跟核染色体当中的常染色体所承载的DNA不同,线粒体DNA天然不存在双倍体,因此具有单倍体研究的意义(虽然线粒体中可能包含多个环状的线粒体DNA的拷贝,但这些DNA环都只是单克隆的,跟核DNA的二倍体的情况完全不同);核染色体当中的Y染色体(只有男性有)也是单倍体,与此类似。

单倍体+加上父系或者母系单侧遗传,为我们研究祖源提供了最好的依据。

根据遗传学家的不懈研究,经过对全世界主要族群的调查、统计和分类,目前已经制作出了全世界主要族群的线粒体DNA单倍体群的世系树状图。之所以是树状而且这棵树还只有一个根,那是因为全世界人类似乎都拥有同一个母系祖先,即闻名于世的“线粒体夏娃”(当然我们也可以中国化这个概念称之为“线粒体女娲”)。

世界线粒体DNA单倍群树及地理分布

上图中的每一个字母都代表着人类历史上的某一位关键的“亲妈”,因为她的线粒体发生了一个被广泛传播的突变特征。

从上图可以查出,中国地区人类主要线粒体类型主要是:M7,M9a,N9,R9b,A,F,C,Z,G,D等。(字母顺序只是表示发现时间先后,并不表示亲缘继承关系)。

线粒体突变产生的机制

导致一个人全身性的线粒体DNA与母亲不同的根本原因是生殖系突变。也就是母亲的卵细胞中的线粒体DNA发生了突变。

生殖系突变(Germline mutation)是遗传学上的一个术语,与体细胞系突变相对,用于特指发生在生殖细胞(精子和卵子,以及受精卵)中的突变。生殖系突变会产生可遗传的特征,并且会复制到个体所有细胞(包括后代的体细胞和生殖细胞在内),而这些特征与父母及同胞都不同。

体细胞突变(左)和生殖系突变(右)的差异

由于线粒体DNA与父亲物管,因此线粒体DNA的突变主要产生于母亲的卵子当中。具体的突变原因主要有两种:

  • 卵子细胞内源性的因素:主要是氧化应激,因为卵子不会自我复制,也就不存在因为复制而导致的错误以及修复错误等突变方式。卵子在女性诞生时就已经存在,因此卵子会伴随女性走过很长的时间,在这么长的时间里面卵子内的遗传物容易积累突变。
  • 外源性因素:主要是化学物质和电离辐射(注意跟电磁辐射的区别)导致;

线粒体环状DNA的突变,导致线粒体功能异常

总结

记住:不管你是男是女,不要以为你跟爸姓就只是爸家的儿子或者女儿,线粒体DNA可都是亲妈给的!而直男癌们也不要总以为自己的Y染色体才是传家宝。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多