分享

深度解读| 大样本人类诱导多能干细胞转录组研究| 高分文章

 医学院的石头 2017-12-28
诱导性多能干细胞iPSC(induced pluripotent stem cells),是一种经过重编程技术诱导产生的、具有多种分化潜能的干细胞,它在再生医学、药物研究、疾病模型等方面具有重要的价值。研究表明,iPS细胞系之间存在差异性,如细胞来源、遗传背景、表观遗传学差异都可以导致iPS细胞系之间的差异。但这些研究大部分是在小鼠的胚胎干细胞中进行、或者使用的人iPS细胞系数量有限。

为了更好的研究同一个体和不同个体来源的iPS细胞系之间的转录组差异,The NextGen Consortium建立了庞大的人类iPS细胞库,同时产生大量的RNA测序数据和基因组数据供科研人员使用。该项目的开展对人类iPS细胞的研究起到了巨大的推动作用,相关研究论文于2017年4月发表在Cell Stem Cell杂志上。


IPS细胞诱导和质量控制(QC)

利用非基因组整合的重编程技术(仙台病毒)将196个个体的外周血单核细胞(PBMCs)诱导生成iPS细胞,并完成了免疫荧光的鉴定。目前已经完成了106个个体的337个iPS细胞系的RNA测序分析。为了避免在大样本的研究中造成样本间的交叉污染,作者将杂合SNPs的genotype数据与RNA-seq数据进行比对,匹配程度大于90%则表明样本没有交叉污染。利用这一标准去除了来自5个个体的20个iPS细胞系。

由于iPS细胞系数量巨大以及资金的缺乏,作者没有进行裸鼠畸胎瘤实验来鉴定iPS细胞,而是将iPS细胞系的RNA-seq数据与已发表的人iPS细胞和ES细胞的RNA-seq数据、以及GTEx多个成熟组织的RNA-seq数据进行比较和聚类分析,结果显示大部分的iPS细胞系与已鉴定的iPS细胞和ES细胞聚为一类,有别于GTEx的多个成熟组织。作者还利用23个多能性标志物和iPS早期分化的marker基因CDH2进行主成分分析(PCA),进一步去除了7个标准差SD > 3的细胞系,最终有310个iPS细胞系通过QC用于下游分析

这310个IPS细胞系的聚类分析结果表明,来自同一个体的iPS细胞系比不同个体来源的细胞系更为相似,但同一个体来源的细胞系仍然具有异质性。


IPS细胞基因表达差异性来源


个体内差异:校正了个体和技术因素之后,来源于同一个体的不同iPS细胞克隆之间的差异。

个体间差异:校正了技术因素后不同个体间的iPS细胞克隆的差异。

一个基因可能变化水平有大有小、对总体差异的贡献也有大小之分。作者首先评估不同因素对单个基因水平的贡献程度。利用variancePartition将总体差异拆分为10个变量和其他的残余变量。这些变量对总体差异的贡献总和为1,它们与变异的大小程度无关。个体间差异可以贡献~50%的变异,BMI、年龄等因素占很小的比例,剩余~42%的变量主要来源于同一个体不同克隆间的差异。


cis-eQTL是个体间差异的主要来源之一


遗传变异是造成基因表达差异的主要来源。因此,作者进行了cis-eQTL的分析,并得到了4150个cis-eQTL (FDR <>这些cis-eQTL大部分位于基因的转录起始位点附近,富集在iPS细胞和ES细胞的增强子区域,与GTEx的eQTL数据有轻度富集,与多种症状的GWAS 位点也有轻度富集。

同一个体来源的iPS细胞的等位基因特异性表达(ASE)的方式一致

等位基因表达不平衡是iPS细胞差异的可能来源,作者分析了一些典型的印记基因,发现在大部分的iPS克隆里都存在等位基因特异性表达,同一个体不同iPS克隆间的等位基因特异性表达方式比个体间的更为一致。通过ASE分析发现,iPS细胞保持着与供体一致的ASE表达方式。


高度差异的基因与器官发育、组织生成等多个pathway相关

为了找到潜在的导致iPS细胞间差异的原因,作者从分子网络的角度分析了个体内和个体间基因表达的差异程度。利用WGCNA进行共表达分析得到了25个共表达模块,其中有6个模块时富集了top 10% 变化最大的基因,且这6个模块都与发育功能相关。不论是个体内还是个体间,变化最大的基因都与发育的marker相关,变化最小的基因则与一些基本的管家功能相关。


非eQTL相关的差异来源于Polycomb的靶基因

个体间的iPS细胞差异可以用eQTL来解释,而来自同一个体的iPS细胞差异就没那么容易解释了。作者发现,在个体内和个体间top 500变化最大的基因中,有200个是共有的,这200个基因中有194个基因是没有eQTL关系的,表明导致这些基因表达差异的原因并非是eQTL。个体内和个体间变化最大的500个基因都富集在PRC2 ((Polycomb Repressive Complex 2))和H3K27me3 marker相关的基因。值得注意的是PRC2是在进化上比较保守的基因,在细胞的多种功能上发挥重要作用。


从分子网络来解析iPS细胞间的基因表达差异

作者进一步从网络水平解析导致iPS细胞基因表达差异的分子机制,研究那些变化最大的基因是否在网络中发挥关键的作用。利用公共数据库ConsensusPathDB和MetaCore的数据,基于贝叶斯模型,作者构建了一个先验网络,该网络主要整合了蛋白质相互作用(PPI)的数据。为了使该网络是iPS细胞所特有的,作者根据Roadmap Epigenomics Project里2 个iPS细胞系的Histone marker的数据,筛选出在iPS细胞特异性表达的基因,最终得到一个iPS细胞特异性的先验网络。


作者利用RNA-seq数据构建了基因共表达网络,并与构建好的先验网络进行整合,利用pathFinder算法提取与seed 基因(top 差异的基因)连接的基因、蛋白质、代谢产物,从而将先验网络扩大化。为了防止局部网络过大化,作者将扩大步骤(K steps)设置为3。值得注意的事,作者将cis-eQTL基因作为唯一的根基因,任何其他基因都不能是它的上层基因。

这样,就得到了一个因果预测的分子连接网络。之后便利用关键驱动因子分析(key driver analysis,KDA)来寻找网络中的关键基因。

通过KDA分析作者找到了iPS网络中的7个关键调控基因(GATA4, GATA6, EOMES, APOA2, LINC00261(DEANR1), FOXQ1, CER1)。利用上述模型,作者还发现HOXA5和HOXC10是影响iPS细胞向内皮细胞分化效率的关键基因。而找到的这9个KDs在所构建的iPS网络中都位于发育相关的marker基因以及干细胞marker基因的上游,表明该网络能够反映iPS细胞真实的生物学特性,还可以找到关键的调控基因。

总结

这篇文章研究了同一个体和不同个体来源的iPS细胞之间的基因表达差异,从cis-eQTL、等位基因特异性表达和Polycomb靶基因解释了差异的来源,还进一步从分子调控网络阐释了引起这种差异的分子机制。文章也指出了由于genotype数据的限制,该文章并没有检测到对基因表达造成较大影响的罕见变异,这也是文章的一个缺陷。同时,文章还指出,表观遗传学差异也是造成iPS细胞异质性的重要因素,为今后的相关研究指明了方向。

作者:蒙萌哒     排版:夏梦馨

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多