分享

我们的基因中有多少祖先的信息

 stingray928 2018-12-21

在姜文新指导的电影《邪不压正》中,廖凡所饰演的孤儿李潜龙得“高人”指点“认祖归宗”,并改姓朱潜龙,做起了复辟前朝,黄袍加身的大梦。当剧中朱潜龙与蓝青峰手中朱元璋的画像进行对比时,不禁让人笑出声来。

这种认祖归宗的方法看似儿戏,但在缺少现代生物技术的古代,摸骨相面几乎成为了唯一的生物遗传信息识别手段。凭借相貌的相似而断定两人必然有亲缘关系的思维方式也早已根深蒂固,这类认祖归宗的故事在历史上亦不在少数。不过本文中无意讨论荒诞派手法所营造的剧情,今天所要讨论的是,你历史上的某一位祖先能传递给你多少遗传信息,我们又能从遗传物质中寻找到多少祖先留下的故事。


祖先的遗产


从谱系上来说,我们的遗传物质都是来自父母的,由于我们的两套基因组分别来自父母双方,两者所携带的遗传信息量基本是相等的。往前追溯的话,我们每一代的全部祖先看上去都会向我们贡献基本等量的遗传物质。比如父母各贡献二分之一,爷爷奶奶外公外婆各贡献四分之一。。。


然而,我们来自每一代祖先的遗传物质并不是像鸡尾酒那样完全均匀的调和在一起。我们知道人类的遗传信息来自于46条染色体和一条线粒体,我们有23条染色体来自父亲,另有23条染色体和1条线粒体来自母亲。由于卵子与精子在产生的时候会经历染色体重组,一个精子中的染色体是由父亲的46条染色体随机选取23条形成的。比如来自父亲的23条染色体中可能有12条来自爷爷,11条来自奶奶。如果按照这个模式,每一条染色体都可以追溯到一个最早的祖先。我们全部46条染色体和一条线粒体就和以追溯到47位最早的祖先。

但是,在精子和卵子的形成过程中,除了简单的重组之外,还存在交叉互换的过程。两条同源染色体会交换一部分片段,这样一条染色体可能会拆分成两到三个片段。研究发现,在精子的产生过程中,染色体平均会增加26个接口,也就是增加了26个片段。卵子的产生过程中,染色体平均会增加45个接口,也就是增加了45个片段,这样在父母这一代,我们的遗传基因在47份的基础上又多细分出了71个片段,总共118个基因片段。根据研究统计,每往前追溯一代我们的遗传基因同样都会增加71个片段。

染色体的交叉互换


由于我们的祖先数量每一代都会翻倍,呈指数增长。而我们遗传信息所分成的片段每一代增长的数值都是固定的,呈线性增长。往前追溯几代之后,我们的祖先数量将会逐渐超出我们遗传信息所能分成的片段数量。也就是说追溯到历史上的某个时期,可能只有部分祖先贡献了遗传信息给我们。还有一些祖先虽然在我们的家谱树上,但我们并没有从他们那里获得遗传信息。即便是那些遗传给我们基因片段的祖先,每个人所贡献的也只是很小的一点比例。

每一代祖先人数与基因片段数增长的比较


回到故事的开头,朱潜龙认作祖先的朱元璋生于1366年,故事发生在1937年的北平,中间相隔了570年,即使以30年一代人计算,从朱元璋到朱潜龙已经经历了19代人,是名副其实的“祖宗十八代”。朱潜龙在这一代一共有2621442的18次方)个祖先。追溯到这一代,他的遗传信息可以划分为132547+71×18)个片段。也就是说这一代只有千分之五的祖先为他贡献了遗传基因,而贡献了遗传基因的每个祖先只能在全基因组中平均分到不足千分之一的遗传贡献。即使考虑到某些祖先在谱系树上可能重复出现,他们所能贡献的遗传信息依然是非常有限的。

由于一个人的外貌是在多个基因组共同调控下形成的了,并且还受到外界环境因素的影响。由此看来想通过外貌的相似来确定自己和历史上某个人物的亲缘关系并不靠谱。更不用说外貌的比较还有很多主观性的判断在里面。



基因家谱


那么如果朱潜龙确是朱明后裔的话,该怎么从遗传学角度证明自己的身份呢?

作为朱元璋的直系男性后代,朱潜龙会从他那里得到一条每一代伴随男性遗传的Y染色体。尽管Y染色体所携带的信息量很小,只在性别发育过程中起到开关的作用,并不会影响具体的体质特征。但每一代的Y染色体都会继承其祖先Y染色体上发生的突变。由于不参与基因重组的特殊性,适于通过这些突变构建起代表父系和的谱系树。这个Y染色体谱系树相当于一本基因家谱,通过与其他朱明宗室后裔比较在谱系树上的位置,便可以确认其是否是朱元璋的子孙。


Yfull网站上某父系家族的Y染色体谱系树

TMRCA代表最近共祖时间,ybp代表距今年限)


Y染色体类似的还有每一代只伴随女性遗传的线粒体DNA。通过对线粒体突变进行建树同样可以得到不同个体之间母系家族的关系。利用DNA谱系树来确定身份最为知名的案例便是英国的“停车场国王”理查三世。

理查三世肖像画


理查三世的遗骨于2012年在兰开斯特市政厅的一个停车场被发现。2014年,莱斯特大学的科学家对遗骨进行了DNA检测,得益于英国贵族详细的谱牒信息,科学家找到了理查三世同胞姐姐安妮的母系后裔,通过比对线粒体DNA一致(同属于线粒体单倍群J1c2c)而确定了他的身份。

然而父系结果的对比却出现了矛盾。检测结果显示理查三世的Y染色体属于单倍群G2-P287。理查三世的父系来自英国金雀花王朝国王爱德华三世四子埃德蒙所创立的约克家族,如果父系传承没有问题的话,他会与爱德华三世三子冈特的约翰所创立的兰开斯特家族直系男性后裔属于同一父系单倍群。但是,对兰开斯特家族男性成员第五代博福特公爵亨利·萨默塞特后裔的检测却显示他的父系属于Y染色体单倍群R1b-U152。这也暗示了英国王室家族历史上可能存在着一段不为人所知的秘辛。

历史上以白玫瑰为族徽的约克家族与以红玫瑰为族徽的兰开斯特家族曾经为争夺英国王位而掀起了旷日持久的“玫瑰战争”,如今两个家族的基因检测结果又将争斗蔓延到了另一个战场。不过对于现代的英国王室来说,他们的王位继承可以追溯到代表了红白玫瑰两个家族联姻的都铎王朝,而王位宣称权的流转过程中又历经了多位女性,所以两个家族父系检测结果的矛盾并不会直接影响到王室的合法性。至少我们还需要对更多的王室后裔和古代样本进行检测才能确定这桩宫廷丑闻具体发生在哪两代人之间。


理查三世与比对样本的谱系树

灰色连线代表了谱系上可能发生“非父亲生”事件的环节



谱系树中隐藏的信息


通过对比谱系树上同一祖先不同支系的后代,我们可以推测出这个祖先的姓氏、生活的地区、年代等一系列信息。如果一段时期谱系树上出现了多个枝杈的分化,则说明这一时期的祖先可能处于适宜生存的环境,或是掌握了大量的自然社会资源,因而有了繁育更多后代的机会;如果在一段时期支系树上没有出现新的分支,则说明祖先在这一时期可能处于较为艰苦的生活环境中,由于人口增长速率的限制而形成了支系分化中的“瓶颈期”。

不过这种对比所得到的只是某一特定时期的情况,像是从连续放映的影片中抽取的一帧一帧的定格画面。只有寻找更多不同时期的分支,才能修复越来越多的画面,最终让影片流动起来,看到父系家族甚至是人类群体从古至今发展过程中的诸多细节。但是由于人群繁衍过程中的高淘汰率,幸存于今的都是人类历史上极为少数的支系。

谱系树上现存世系与曾经出现的世系比较


即便现在有日益丰富的古DNA数据,对于人类漫长的历史进程来说也是杯水车薪。两帧画面之间的“瓶颈期”,由于没有其他支系的佐证,我们无法推断瓶颈期里祖先的信息,比如他们是谁,生活在哪里,是否经历了漫长曲折的迁徙,可能发生了哪些故事。“瓶颈期”像是一个“黑洞”,吞噬了我们祖先在这一时期的所有信息。所以,从理论上来说,我们最终无法通过遗传基因恢复人类历史的全貌,只能通过尽力搜集现有的样本进行比对,逐渐接近真实的历史。


编者简介


郁乎文哉:爱好历史的理工男。





    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多