摘要 启动子DNA甲基组的动态失调是癌症的特征。然而,关于DNA甲基组是如何参与转录调控回路以及如何参与调控癌症中基因表达异常的全面理解仍然缺乏。我们引入了一个基于互信息理论的综合分析管道,该管道专为癌症基因组图谱(TCGA)中的多组体谱数据量身定制,以系统地找到21种癌症类型的启动子CpG甲基化图谱对转录调控电路的依赖性。通过将转录因子与CpG位点偶联,这种癌症类型特异性的转录调控电路恢复了许多癌症相关基因的重要表达调节层。 研究结果 图1 图1:由启动子CpG甲基化水平调节的TF-靶基因调控电路的全基因组鉴定。 (A)依赖于特定启动子CpG位点的甲基化水平的TF-靶基因电路搜索方法的示意图。以Tfi(Tfi)、潜在的靶基因j(Genej)及其DNA拷贝数(CNVj)以及靶基因j的启动子区域内的CpG位点m(CpGjm)为例,该图显示了如何使用多组学数据来测试TF-靶基因关联是否依赖于启动子CpG甲基化。将真负数的模拟数据条目添加到原始数据集中,并用于估计管线每一步的错误发现率。管道的详细信息在方法详细信息部分中提供。 (B和C)显示启动子CpG位点的甲基化水平与BLCA肿瘤中的基因表达谱之间的正(B)和负(C)相关模式的例子。 图2 图2:存在于MeTRN中的3个TF,JunB,STAT1和JUD的目标基因。 (A-C)3个TFs的靶基因JunB(A),STAT1(B)和Jund(C),它们存在于至少3种癌症类型的MeTRN中。提供了在目标基因列表中富集的生物功能和过程,并且通过连接该术语和基因的线来表示被注释为富集术语的基因。TFspecific chip-seq数据支持的靶基因用蓝色轮廓突出显示。 图3 图3:MeTRN对基因表达谱的预测能力。 (A)使用具有不同预测变量(TargetTF+CpG位点,TargetCNV和TargetTF+CpG位点+CNV)的线性回归模型来拟合每种癌症类型的MeTRN中每个目标基因的表达谱。每个基因的决定系数(R2)是根据特定癌症类型的数据从这些模型中计算出来的。准备盒图以显示每种癌症类型的这3个不同模型的所有基因的R2值的分布。晶须延伸到四分位数范围的1.5倍。 (B)散点图示例(BLCA)显示来自两个回归模型(TargetTF+CpG位点和TargetCNV)的每个基因的R2值。这些点由TargetTF+CpG+CNV组合线性回归模型中每个基因的R2值着色。几条对角线用灰色线条标记,其中点的x轴值加y轴值相同。 (C和D)高度依赖于MeTRN中TF-CpG电路的TOP基因中富集的生物和生理过程和高度依赖CNV的TOP基因中富集的过程。颜色的饱和度表示每个项的统计显著性。 图4 图4:癌症相关基因表达谱的MeTRN和CNV的预测能力。 (A)使用具有不同预测变量的线性回归模型来拟合每种癌症类型的肿瘤中MeTRN中每个癌症相关基因的表达谱。每个基因的决定系数(R2)由这些模型与特定癌症类型的数据计算得出。最后,准备盒图以显示每种癌症类型的这3个不同模型的所有基因的R2值的分布。晶须延伸到四分位数范围的1.5倍。 (B)如TargetTF+CpG位点的线性回归模型中的R2值所示,前10个基因被显示为在多种癌症中高度依赖MeTRN调节子的癌症基因的例子。来自TargetTF+CpG、TargetCpG位点或特定癌症类型的TargetTF模型的特定R2值用竖条标记,其颜色表示癌症类型。在MeTRN网络中发现基因作为靶标的癌症类型的数量显示在基因名称后面的括号中。 (C)预测在至少3种癌症中靶向FLI1的5个TF。46个启动子CpG位点中的42个参与了这些转录回路。 (D)预测在STAD中针对FLI1的18个TF。这18个TF中有12个预测仅在STAD中靶向FLI1。36个FLI1启动子CpG位点参与。 图5 图5:基于癌症基因表达的MeTRN和CNV的预测能力的癌症之间的相似性。 (A)癌症相似性矩阵,指示每对癌症中癌症基因的R2值之间的Pearson相关性。R2值由TargetTF+CpG的线性回归模型(上三角)或TargetCNV模型(下三角)计算。 (B)散点图显示癌症基因对MeTRN调节器(左)或CNV(右)的依赖性,以两种癌症为例,STAD和LUAD。 图6 图6:MeTRN中的TFS和CpG位点作为预后不同患者亚群的分类器。 (A)以Kirp为例。如线性组合模型TargetTF+CpG所示,用MeTRN中DNA甲基化依赖的转录调节电路的CpG位点甲基化和TF表达谱进行无监督的层次聚类分析,其显示了对目标基因表达谱的强大预测能力。聚类分析中的患者亚组(K1-K4)用不同的颜色标记。 (B-D)Kaplan-Meier生存曲线显示了根据其MeTRN调节剂(B)、顶部可变CpG位点(C)或ARACNe预测的TF(D)确定的Kirp患者不同亚组之间的总体生存率的比较。用对数秩和检验推断癌亚型间预后差异最大的统计学意义的p值。 图7 图7:由MeTRN调节器分类的两种预后不同Kirp亚型之间的比较。 (A和B)用于图6中聚类分析的MeTRN调节子(分别为CpG位点和TF)的差异甲基化(A)和差异表达(B)分析。781个CpG位点和17个TF分别被认为在K3与K1中强烈上调和下调。 (C)在Kirp MeTRN中发现了(A)和(B)中鉴定的CpG位点和TF的598个靶基因。通过比较K3和K1,进行GSEA分析以显示下调基因中598个目标基因的富集。 (D)598个靶基因的基因功能富集分析。富集p值截止值被设置为0.01。 结论 耦合的CpG位点和转录因子也可作为具有不同预后的癌症亚型分类的标记,这表明这种调节机制在生理上的相关性在这里重述。因此,我们的结果为进一步研究癌症中基因表达失调的表观遗传方案提供了资源。 DOI:10.1016/j.celrep.2019.02.084 参考文献 [1].Almeida, L., Silva, J.A., Andrade, V.M., Machado, P., Jamieson, S.E., Carvalho, E.M., Blackwell, J.M., and Castellucci, L.C. (2017). Analysis of expression of FLI1 and MMP1 in American cutaneous leishmaniasis caused by Leishmania braziliensis infection. Infect. Genet. Evol. 49, 212–220. [2].Aran, D., Sirota, M., and Butte, A.J. (2015). Systematic pan-cancer analysis of tumour purity. Nat. Commun. 6, 8971. [3].Basso, K., Margolin, A.A., Stolovitzky, G., Klein, U., Dalla-Favera, R., and Califano, A. (2005). Reverse engineering of regulatory networks in human B cells. Nat. Genet. 37, 382–390. [4].Blattler, A., and Farnham, P.J. (2013). Cross-talk between site-specifific transcription factors and DNA methylation states. J. Biol. Chem. 288, 34287– 34294. END |
|