分享

文献精读| 多组学数据整合示例brain xQTL | 公共数据发高分SCI| Nature Neu...

 生物_医药_科研 2019-04-02

前言  introduction

GWAS研究发现了大量的与疾病相关的SNP位点,但是这些位点多位于非编码区。而将这些非编码区的变异与特点的基因或者分子通路联系起来却让研究者很头疼。表达数量性状位点(eQTL)的研究为连接非编码区的变异和特定的基因/通路带来了一线希望。已有研究证明eQTL研究对于理解疾病/性状相关的变异的功能,以及鉴定疾病相关的基因具有重要意义。近来,随着表观遗传学的兴起,DNA甲基化数量性状位点(meQTL)以及组蛋白修饰数量性状位点(haQTL)也开始进入人们的视野。但是将不同维度的数据进行整合,给出脑的多组学QTL及其关系仍然是一个空白点。

今天跟大家分享的这篇文章是2017年9月4日提前在线出版的Nature Neuroscience(IF=16.7)上的一篇Resouce文章。文章使用的是已经发表的公共数据,整合了基因型,基因表达谱(RNA-seq),DNA甲基化组和组蛋白乙酰化组的数据,并探讨了他们之间的调控/媒介关系。是一篇学习高级统计遗传方法和进行复杂数据整合分析的优秀范例。

通讯作者:Sara Mostafavi, Philip L De Jager

研究梗概

文章主要利用来自ROSMAP项目的死亡后捐献的脑组织所获得的基因表达,DNA甲基化和组蛋白乙酰化的数据,进行QTL的鉴定;然后比较了得到的QTL与已经发表的QTL的研究的重复率,以及脑的QTL在其他组织的重复性;进而通过染色质状态分析,得到了这些QTL的SNP所处区域的特点;接下来研究者还探索了不同维度的QTL之间的调控/媒介/因果关系;最后利用QTL的结果来探索与疾病的关系,并提出了一种新的发现风险基因的方法。

数据集介绍

ROSMAP

Religious Orders Study (ROS) 和 the Rush Memory and Aging Project (MAP)的简称,这两个项目由同一批科学家设计。以研究衰老为主要目标,是一个长期的研究项目。目前有超过1900个捐献者,其中脑的样本有七百余个,主要采集背外侧前额叶的样本,进行了多维度的组学测定,包括DNA甲基化(450K芯片测定),基因表达(RNA-seq测定),组蛋白乙酰化修饰(H3K9ac ChiP-seq测定),microRNA表达量(芯片测定),此外每个个体具有完备的基因型数据。所有数据集可在Synapse下载。

(Website:https://www./#!Synapse:syn3219045)

CommonMind

CommonMind Consortium (CMC). The CMC is generating data across multiple regions from >1000 postmortem brain samples from donors with Schizophrenia, Bipolar disease and individuals with no neuropsychiatric disorders - originating from tissue collections at four brain banks. Data consists of DNA and RNA sequencing, genotyping and epigenetics. The goal of this is to provide the opportunity for researchers to assess the quality of the data and results in order to (1) estimate the likelihood of our biological conclusions and (2) determine the most meaningful way of incorporating these findings into their own research.

(Website:https://www.//#!Synapse:syn2759792)

Braineac

The aim of Braineac is to release to the scientific community a valid instrument to investigate the genes and SNPs associated with neurological disorders.该数据库有来自134个个体的10个脑区的基因表达数据,并利用基因型数据,做了eQTL的分析。

(Webstie: https://ukbec./)

GTEx

Genotype-Tissue Expression, GTEx基因型-组织表达研究联盟。

The Genotype-Tissue Expression (GTEx) project aims to provide to the scientific community a resource with which to study human gene expression and regulation and its relationship to genetic variation. This project will collect and analyze multiple human tissues from donors who are also densely genotyped, to assess genetic variation within their genomes. By analyzing global RNA expression within individual tissues and treating the expression levels of genes as quantitative traits, variations in gene expression that are highly correlated with genetic variation can be identified as expression quantitative trait loci, or eQTLs.

(Website:https://www./home/)

xQTL discovery

研究方法和质量控制过程如下

得到的xQTL对,如表格所示

显著性水平,见如下曼哈顿图

遗传结构分析

在进行了QTL分析之后,研究者便去探索,这些xQTL的SNP的基因组结构是否什么特点。首先,利用USCS的一直基因注释,研究者发现发现这些xQTL的SNP,在外显子区的富集高于在内含子区的富集程度,这种趋势在meQTL的SNP尤其明显。

进一步,研究者利用ChromHMM软件,对这些SNP的位置,进行了更细致的研究,发现:

  • eQTL和haQTL的SNP主要富集在启动子区和转录区域;

  • 而meQTL的SNP主要富集在启动子或增强子区域,以及polyComb区域;

  • Overlap QTL 的SNP 主要富集在转录起始位点附近和转录的5‘和3’区域。

重复性分析

使用π1 统计量,本文评估了,eQTL与以往的脑的eQTL的重复性,以及不同组织的重复性。

MeQTL的结果,与Johnson Mill组的胎脑的数据进行了比较。

而haQTL,由于相应研究较少,所以并没有找到可以用来重复的数据。

较高的cross-study 和cross-tissue的重复率表明很多的SNP对于分子表型的调控可能是共享的。

脑特异性的eQTL

尽管不同组织之间的eQTL的重复率较高,但是研究者团队还是发现了一些QTL似乎只在脑中存在。如下图散点图所示,X轴表示在脑中QTL的-log p值,Y轴表示在血液中QTL的-log p值,红色的虚线代表了显著性阈值。B途中对A图进行了放大,可以看到,在绿色框框中的部分,在血液中没有达到显著性,而在脑中却是显著的QTL信号,所以作者认为这些信号是脑特异性的信号。

其中NLRP1基因就是一个很好的脑特异性QTL的基因。

如下图所示

在所有的脑和血液中同时可检测的eQTLs中,共鉴定出809个eQTL的靶基因,他们是在脑中被SNP调控,在血液中几乎不表达。GSEA分析发现,这809个基因富集在一些脑相关的功能中,如神经系统,钾离子通道和神经递质绑定等。

xQTL之间的调控关系

一直以来,SNP,表观遗传以及基因表达之间的调控方向一直是研究者感兴趣的问题。由于本文所用数据的全面性,同一个个体有不同组学的数据,为探索SNP,表观遗传和基因表达之间的关系提供了极大的便利。

作者首先,进行了overlap分析,共2,305,942 SNPs 具有可检测的调控的分子,有10,897SNP可同时调控methylation, expression 和 histone modification.

在简单的overlap的基础上,作者使用casual inference test (CIT)来进行因果分析,探究SNP对表观遗传或表达的调控之间的级联关系。文章提出了三种可能的模型:

1, 独立模型independent effects of a SNP on cis gene expression and the cis epigenetic landscape (independent model or IM),

2, 表观遗传介导模型a propagation path from SNP to gene expression via epigenetic modifications (epigenetic mediation model or EM),

3, 基因表达介导模型,a propagation path from SNP to the epigenome (namely DNAm) via gene expression (transcription mediation model or TM)

分析结果显示

如上图所示,85%的SNP支持独立模型,9%的SNP支持表观遗传介导模型,3%的SNP支持基因表达介导模型。

研究者分析可能的原因为:

1. epigenetic modification playing a passive role where gene expression in fact lies upstream of epigenetic modification (3% based on the TM model);

2. regulation of gene expression being dependent on a more complex combination of epigenetic marks.

同时,研究者将DNA甲基化和组蛋白乙酰化分开进行分析,发现得到的结果只是原来结果的一个子集,其中3%可以被DNA甲基化所解释,6%可以被组蛋白乙酰化所解释。

Thus, a complementary (non-redundant) combination of DNA methylation and histone acetylation seems to be required to capture the mediation effect, and adding other non-redundant epigenetic features would likely further enhance detection of this type of functional propagation.

细胞类型特异性的QTL

研究者利用计算的方法计算了不同细胞类型的比例,并把细胞类型的比例作为一个协变量,重新做QTL的分析,那些在去除了细胞类型的比例这一协变量后,QTL就不显著的被定义为细胞类型特异性的QTL。使用FDR< 0.05的阈值,发现了6个细胞类型特异性的QTL信号,

放宽标准到FDR<0.2后,发现44个细胞类型特异性的QTL,如图所示

xQTL与疾病的关系

使用GWAS信号,发现xQTL信号,显著富集于一些复杂性状和疾病中,如下图所示,xQTL显著富集于阿尔兹海默症(AD),焦虑,双相,重性抑郁等的GWAS信号中。

基于此发现,作者还提出了一种新的用于发现疾病风险基因的方法,xQTL-weighted GWAS,此方法使用一种加权的Bonferroni流程,为GWAS分析的SNP根据QTL赋予权重。通过与非加权的方法比较,研究者分别在精神分裂症发现了22个新的位点,在身高中发现了18个新的位点,炎症性肠炎中的9个新位点。

总结    

本文提供的资源,可以为神经科学研究者的进一步研究提供诸多便利,对于探索基因组,表观组和转录组,以及跟疾病的关系提供了珍贵的资源。

同时本文是一个很好的数据整合分析的范例,创造性的探索了不同的组学之间的关系,同时在多数据集比较和多组织比较中也给出了一套可行的统计学分析方法。

局限    

近年来可变剪切的研究也成为了热点,但是本文并没有涉及splicing QTL的内容,ROSMAP的数据为可变剪切的研究也提供了便利。此外microRNA的QTL也是可以考虑的探索点。

需要注意的是,本文使用的血液的QTL的研究并不是目前样本量最大的数据集,Depression Genes and Networks项目只有922个样本,目前最大的血液的QTL研究已有超过5000个样本。

文章中使用的进行因果分析的方法——CIT与目前流行的孟德尔随机化为基础的方法之间的比较也并没有讨论,同时,介导模型尚无法区分,同时具有介导功能又具有多效性的情况。

还有一点需注意,本文所用的数据来源的样本,多为老年人,且部分患有不同程度的老年痴呆,疾病状态会对基因表达及表观遗传产生影响,所以本资源,并不能完全看为是正常状态下的调控资源。

作者&排版:夏梦馨

封面图片:来源于阅图

原创声明

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多