分享

人类表观基因组:欧洲数据“一家独大”,汉族数据难觅

 风湿中心 2022-08-04 发布于上海

基因组研究对了解疾病病因和风险至关重要。最近,有研究人员提出在基因组研究中缺乏种族和民族多样性,并呼吁对不同人群开展更多研究。

在过去十年中,国际人类表观基因组联盟(International Human Epigenome Consortium, IHEC)的工作使得我们对调控元件的理解取得了很大进展,IHEC绘制了各种组织和细胞类型中的染色质数据集和调控元件。这些顺式调控元件和染色质数据集的综合目录可应用于不同领域,如基因组变异注释、基因位点精细定位、基因编辑方法和单细胞测序分析流程的设计。

(注:国际人类表观基因组联盟(IHEC),由来自多个国家和实验室的团队共同参与,致力于提供一个公开免费的人类表观基因组学图谱,包括了正常人类和各种疾病细胞相关的数据。)

目前IHEC样本关于种族或民族的信息很少。研究人员查询了IHEC公开数据集,以获取与种族或民族和原籍国相关的不同统计指标,发现只有42.7%的试验报告了种族或民族信息。在5 048个公开有种族或民族信息的试验中,87.1%(n=4397)被标记为“欧洲人”;9.3%(n=470)报告为非洲人、非裔美国人或黑人;1.7%(n=87)为亚裔,其余(1.9%, n=94)为其他族裔,表明用于分析的样本中存在相当大的种族或民族差异。2009~2021年,对欧洲样本的试验数量增加,远远超过对其他种族和民族样本的试验(图1)。尽管2021年发布了一组针对特定非洲人群(例如卢希亚、马赛、门德、埃桑和冈比亚人)的试验,增加了数据多样性,但仍然严重缺乏来自其他地区(例如南亚和中东)的人群。

图1 表观基因组数据样本随时间推移,多样性的变化
图中显示了公开的IHEC数据(2009—2021年,左)中每年累积的样本数量。图表的不同部分按照IHEC中的种族用颜色编码。从相关研究中获得种族信息。如IHEC中所示,来自欧洲族裔个体的样本占很大比例(红色)。放大图表(右),突出显示了同一时间段内非欧洲人群的累积样本量

图2 各种检测所覆盖的表观基因组数据样本的多样性
甜甜圈图(底部)显示了不同检测方法(外环)和不同种族(内环)的样本总数。由于来自欧洲种族个体的样本占很大比例,因此提供了一个放大图(上),显示了在非欧洲人样本数(n)> 5的实验中,不同检测方法所覆盖的非欧洲样本的比例

表观基因组分析所用的序列和组织的广度,欧洲比其他人种和民族更为广泛。在这些分析中,ATAC-seq、DNase-seq、ChIP-seq和DNA甲基化阵列显示了高度多样性,数据来自六个以上的人群(图2)。虽然西班牙裔在相对较少的试验(n=60)中出现,但与其他非欧洲人群相比,该人群在主要分析类型中有更全面的注释,如RNA-seq、DNase-seq和ChIP-seq。研究人员还注意到,来自非欧洲人群的数据主要来自细胞系。虽然有价值,但细胞系的永生化和连续传代可能导致原代细胞和组织中不存在的表观遗传学变化。在原代组织中进行的试验绝大多数来自欧洲人样本。鉴于非欧洲人原始组织样本的数据有限,因此很难评估不同人群中组织特异性调控元件的差异。

在描述不同人群的调控元件时,一个主要问题是DNA序列变异的作用。与祖先相关的DNA序列变异在多大程度上影响表观遗传修饰尚不清楚。然而,有证据表明,人群之间存在广泛的表观遗传变异,尤其是DNA甲基化。虽然表观基因组中的某些部分会受到环境暴露的影响,但许多表观遗传变化是由DNA序列的变化驱动的。例如,双胞胎研究表明,DNA甲基化的平均遗传率为19%,有些区域的遗传率超过90%,表明DNA甲基化可能在很大程度上由潜在遗传变异决定。

其他研究报告了个体祖先特异性DNA序列变异和不同人群DNA甲基化差异之间的关联。鉴于这些证据,预计未来可能会发现更多基因型、DNA甲基化和祖先之间的关联,可能有助于解释不同人群的疾病风险差异。简言之,与祖先相关的DNA序列变异在驱动表观遗传变异方面的作用需要进一步研究,特别是在疾病相关基因位点方面。

不同人群的表观遗传资源可能有助于对疾病相关基因组区域的注释和解读。全基因组关联研究(GWAS)已经识别出与各种疾病和性状相关的数千个变异。然而,其中许多变异位于基因组的非蛋白质编码区,功能尚不明确。将这些变异映射到调控元件,包括启动子、增强子和抑制子,通过多种组织和细胞类型的表观基因组标记,可以对功能机制提供重要见解。目前的表观基因组图谱资源(主要以欧洲为中心)在多大程度上促进了不同人群中GWAS基因座的解释尚不清楚。然而,来自不同人群的表观基因组图谱数据可能会改善对疾病相关位点的解读,识别出与非欧洲人群负担较高疾病相关的变异——如前列腺癌、高血压、慢性肾脏疾病。

总之,有必要进行更多的研究,以评估不同人群的表观基因组多样性,并确定人群变异的程度。表观基因组研究中应增加人群多样性。改善表观基因组资源的多样性将会加速我们对不同人群疾病风险和健康差异的理解。

参考文献:Breeze CE, Beck S, Berndt SI, et al. The missing diversity in human epigenomic studies[J]. Nature Genetics,2022,54:737-745.

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多