分享

Nature Communications| 参与肝细胞癌发生和发展的复发性失调lncRNAs研究

 生物_医药_科研 2019-08-09

来源:探肝


研究背景

       肝细胞癌(Hepatocellular carcinoma,HCC)是人类最常见、最具侵袭性的恶性肿瘤之一。HCC细胞经常入侵门静脉系统,继而发展为门静脉癌栓(portal vein tumour thrombosis,PVTT)。近年来,大量研究发现,lncRNA在肿瘤的发生发展及转移过程中均具有极其重要的作用 ,它既可作为原癌基因促进肿瘤的生成,亦可作为抑癌基因来抑制肿瘤细胞的增殖、迁移等。在许多癌症的发生发展中均伴随着lncRNA异常表达。已有研究表明lncRNA与HCC的发生有关,但是目前尚未对其与HCC转移机制进行综合分析。

       本研究对20个患者的60个HCC临床样本进行转录组测序,同时结合基因组、转录组和DNA甲基化数据进行多组学综合分析。鉴定出原发性肿瘤与PVTT的复发性失调lncRNA,同时对候选lncRNA的调控机制和功能进行深入研究,以期获得与HCC肿瘤发生和转移相关的生物标志物。

文章信息

文章题目:Recurrently deregulated lncRNAs in hepatocellular carcinoma

杂志名称:Nature communications

发布日期:2017.02

材料与方法

1、 研究材料:

       20个HCC患者的60个配对临床样本,每位患者三个配对的样本:原发性HCC肿瘤,邻近的正常肝组织和PVTT。

2、 技术平台

 RNA-seq;Affymetrix CytoscanHD arrays;HumanMethylation 450k芯片。

3、 研究思路:

       本研究从60个HCC样本的lncRNA鉴定、筛选以及与公共数据库的关联入手,同时结合了基因组(CNV分析)、转录组(lncRNA鉴定)和表观遗传学(DNA甲基化)等多组学数据进行综合分析,研究了lncRNA的分子机制及表达模式。进一步通过肝癌相关lncRNA共表达网络的构建和RNAi功能的研究,验证了复发性失调lncRNA在HCC肿瘤发生和转移过程中的重要作用。

研究结果

1、 鉴定HCC临床样本中的候选lncRNA

       为了系统地鉴定与HCC中了发生和转移相关的lncRNA,对来自20个患者的60个样本进行RNA测序(去除核糖体RNA),每个患者搜集三个配对样本:原发性肿瘤、癌旁正常组织和PVTT;对测序数据进行参考基因组比对及转录本拼接,通过GENCODE(V19)数据库注释过滤蛋白编码基因及数据库中收录的已知lncRNAs,进一步根据转录本长度、exonic数、基因表达水平、编码潜能(CPC和COME软件计算)对剩余转录本进行筛选,最后鉴定到8603个新的候选lncRNA(图1A)。在其他研究中只报道了少部分新组装的候选lncRNA,例如,将新组装的候选lncRNA与MiTranscriptome数据库进行比较,结果显示有76%的lncRNA在MiTranscriptome数据库中没有发现(图1B)。

       接下来,作者分析了新组装lncRNA的基本特征,并将它们与蛋白质编码基因和GENCODE lncRNA进行比较。因为它们具有较少的假定外显子,发现新组装的lncRNA转录本比蛋白质编码基因短,但比GENCODE lncRNA更长(图1C)。这一结果表明,该研究的高测序深度使其能够组装接近其全长的长转录本,即使它们的表达水平更低(图1D)。值得注意的是,与蛋白质编码基因和GENCODE lncRNA相比,新组装的lncRNA在进化上保守性较低,而与内含子区域相比,外显子区域更加保守(图1E)。先前的一项研究报道,几乎90%的SNP位于非编码区。为了研究lncRNAs与疾病之间的关系,作者将lncRNA与来自NHGRI目录的GWAS SNP和dbSNP中的随机选择SNP相结合,发现与随机组相比,GWAS SNP在新组装的lncRNA中显着富集(图1F)。这些数据表明新组装的lncRNA在功能上可能与人类疾病相关。

图1. 60个HCC样本中鉴定候选lncNRA

注:图A是HCC样本中系统鉴定lncRNAs的综合实验和计算方案概述;图B为新组装的lncRNA与MiTranscriptome数据库中已有lncRNA的Venn图比较;图C为转录本长度分布;图D为基因表达水平累积分布曲线图;图E为外显子和内含子保守性比较;图F为GWAS SNP与随机选择SNP富集分布。

2、肿瘤和PVTTs中复发性失调lncRNA

       使用GFOLD+,DESeq2和Wilcoxon三种统计方法,分别筛选了和肿瘤发生与转移相关的差异表达lncRNA(图2A-B)。对于原发性肿瘤和邻近正常组织的比较,发现DESeq2和Wilcoxon两种方法的结果更相似(图2A),因为这两种方法都将患者设置重复,而GFOLD根据个体患者评估差异表达。最后,综合三种统计方法的重叠结果,鉴定到与肿瘤发生相关的525个下调lncRNAs和323个上调lncRNAs(图2A,C)。而对于PVTT和原发性肿瘤的比较,发现DESeq2和Wilcoxon鉴定到极少数差异表达的lncRNA(图2B),因为PVTT的肿瘤异质性相对较高(图2D)。因此作者仅使用GFOLD+评估差异表达的结果,鉴定到107个与肿瘤复发转移相关lncRNA(图2D)。

       图2E展示了肿瘤发生相关的lncRNA。本研究中发现的一些与肿瘤发生相关的lncRNA在先前的研究中已经被报道。例如,PVT1促进HCC中细胞增殖,细胞周期进展和干细胞特性的发展。此外,PVTT样本中的一些lncRNA(例如,TEX41,XLOC_014515和XLOC_030220)复发性上调,而其他lncRNA(例如,HAND2-AS1,RP11-731F5.2和XLOC_055355)在PVTT中复发性下调(图2F)。

图2. 原发性肿瘤与PVTTs中复发性失调lncRNA

注:图A-B为采用GFOLD+、DESeq2和Wilcoxon三种筛选方法筛选的和肿瘤发生、转移相关的lncRNA韦恩图比较;C-D分别是复发性失调与肿瘤发生和肿瘤转移相关的lncRNA表达变化热图;E-F为柱状图展示复发性失调lncRNA的实例。

3、失调lncRNA与公共临床数据的关系

       基于复发性失调lncRNA的基因集富集分析(GSEA),作者发现肿瘤发生和转移相关lncRNA的表达水平与另一组已发表数据集中的表达水平一致(图3A-B)。此外,作者还研究了TCGA肝细胞癌(LIHC)队列中复发性失调lncRNA的表达水平,由于TCGA LIHC队列没有PVTT或转移性肿瘤样本,作者比较了有无侵袭性原发肿瘤中转移相关lncRNA的表达水平,揭示了转移相关lncRNA的失调与TCGA患者的临床状态一致(图3A-B)。研究结果表明,筛选得到的lncRNA可以作为HCC肿瘤发生和转移的生物标志物。

       接下来,作者挑选了一个与转移相关lncRNA(RP11-166D19.1)作为实例进行解析。发现RP11-166D19.1可以将TCGA队列中的患者清楚地分类为具有不同存活率的两个亚型。RP11-166D19.1的表达与HCC患者的总生存时间显著相关(图3C)。此外,基于其他临床信息的多变量分析显示低表达RP11-166D19.1亚型比高表达亚型整体更严重:低表达亚类血管侵袭风险更高,高表达亚类中的患者大多分化良好(图3D)。基于619个特征基因的表达模式将本研究的20个原发性肿瘤以及来自先前研究157个TCGA LIHC肿瘤和11个HCC肿瘤聚类成三个亚类,发现与S1和S3亚类相比,S2亚类表达水平显著下调(图3E)。

图3. 复发性失调lncRNAs与TCGA临床数据和其他已发表数据的关系

注:图A为基于TCGA LIHC数据和已发表的肝癌数据,对复发性肿瘤发生相关的lncRNA进行基因集富集分析(GSEA);图B复发性转移相关lncRNAs的GSEA;图C为TCGA LIHC队列总体生存率分析;图D为临床信息的多因素分析;图E为RP11-166D19.1在三个HCC亚组中的表达水平。

4、lncRNAs的DNA甲基化改变和CNVs

       根据lncRNA与配对样本中检测到的CNVs和DNA甲基化变化的相关性,对复发性失调的lncRNA进行分类,一些lncRNA在一些患者中上调表达,而在其他患者则下调表达,本研究将这些lncRNA命名为bimorphic lncRNA(图4A)。使用CytoscanHD阵列分析HCC细胞中复发性失调lncRNA的CNVs。基于GISTIC分析鉴定到4个显著扩增的基因组区域和70个显著缺失的基因组区域(图4B)。为了鉴定CNV驱动的候选lncRNA,我们将复发性失调的lncRNA定位于扩增和缺失的基因组区域,总共有147个复发性失调的lncRNA在缺失区域被鉴定,而在扩增区域中没有发现(图4A)。

       基于60个配对样品的DNA甲基化芯片数据,作者分析了DNA甲基化模式以鉴定受DNA甲基化改变影响的复发性失调lncRNAs。总共有93个(10.1%)复发性失调的lncRNAs的DNA甲基化和表达水平显著相关(图4A,C)。表明它们在肿瘤和/或PVTT样品中的表达水平可能受DNA甲基化调控。例如,HAND2-AS1的表达水平与其启动子区的DNA甲基化水平呈负相关(图4D)。

图4. 复发性失调lncRNAs的调控机制

注:图A复发性失调lncRNA调控机制的概述;图B为使用GISTIC软件分析得到的原发性肿瘤和正常组织之间扩增和缺失的CNVs的染色体分布图;图C为散点图展示了复发性失调lncRNA(彩色标记)受到DNA甲基化改变的影响(PCC为皮尔森相关系数);图D为一个DNA甲基化与lncRNA表达负相关的实例。

5、 利用共表达网络推测lncRNA功能

       为了预测lncRNA在HCC的分子病因学方面的潜在功能和调节机制,构建了蛋白质编码基因和lncRNA 的共表达网络。得到的共表达网络由7,367个蛋白质编码基因,6,377个GENCODE lncRNA和5,612个新组装的lncRNA组成。在网络中有1,286个复发性失调的lncRNAs。将所有蛋白质编码基因和lncRNA分组成43个cluster,每个cluster具有至少100个高度互作的基因。除了cluster内互作之外,不同cluster之间还存在337,609个互作节点,这可以表明它们的功能相关性或调控关系(图5A)。

       在这43个cluster中,发现了4个包含蛋白编码基因且功能有趣的cluster(图5B)。在这些cluster中,复发性失调lncRNA高度富集。例如,GO和KEGG通路富集分析表明,cluster 4中的蛋白编码基因大多与肝脏的有机酸代谢、脂肪酸降解等代谢过程相关。Cluster9中的蛋白编码基因主要参与细胞周期的DNA修复、DNA复制和DNA代谢等过程,影响细胞的迁移。cluster18富集免疫反应基因,参与的T细胞和B细胞受体信号通路,其免疫和炎症反应在肿瘤发展中通过影响侵袭和迁移过程起决定性作用。

进一步探究cluster25,该cluster中的蛋白编码基因显著富集在与转移功能相关的信号通路中,如细胞粘附和TGF-β信号通路,已被证明在细胞增殖、分化、运动和粘附等多种过程中发挥重要作用(图5C)。

图5. 使用共表达网络推测复发性失调lncRNA的潜在功能

注:图A为在编码-非编码共表达网络中挑选的18个互作cluster;图B为挑选的4个cluster的GO和KEGG通路富集,热图显示了选定的cluster中GO和KEGG通路富集值(-log10(P value));图C为cluster25子网络展示四个lncRNA与肝癌相关驱动基因的关系。

6、转移相关候选lncRNA的功能实验

       通过Transwell细胞迁移实验评估候选lncRNA是否在HCC的发展过程中发挥作用。首先选择了10个与细胞粘附相关的lncRNA候选基因,其中有四个lncRNA在TGF-β信号通路中与基因显著共表达,有7个lncRNA在PVTT样本中复发性失调且与肿瘤的转移相关,使用3个肝癌细胞株HepG2、SMMC-7721和HCCLM9进行功能缺失RNAi检测(图6A)。值得注意的是,10个候选lncRNAs中有7个被敲低,显著影响了至少一个细胞系的细胞迁移;三个lncRNAs的敲低,通过抑制或促进细胞迁移,在至少两个细胞系中产生了一致的细胞迁移改变(图6A)。使用qRT-PCR方法,验证了RNAi敲低效率(图6B)。图6C-D显示了三种典型的transwell迁移实验结果。

图6. 调节细胞迁移的候选lcRNA的功能缺失分析

注:图A为10个lncRNA在三个肝癌细胞系中敲低细胞的transwell细胞数超过对照细胞的差异倍数;图B为经qRT-PCR验证的RNAi敲低效率;图C-D细胞迁移实验结果展示

研究总结

       通过对HCC原发性肿瘤和PVTTs的基因组、表观基因组和转录组数据的综合分析,该研究报告了几个发现:首先,基于60个配对样本的高通量测序技术和生物信息学分析,鉴定到了8603个新的lncRNAs;其次,综合多组学分析,揭示了lncRNA表达的复发性失调通常与DNA甲基化和CNV的改变有关;进一步使用共表达网络分析,鉴定了与细胞粘附、免疫反应和代谢过程相关的功能性lncRNAs;最后,使用RNAi功能检测,证明了lncRNA HAND2-AS1在HCC细胞中的功能与细胞迁移相关。

参考文献

Yang Y, Chen L, Gu J, et al. Recurrently deregulated lncRNAs in hepatocellular carcinoma[J]. Nature Communications, 2017, 8:14421.


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多