分享

转录组讲师带你读文献(6)-散发性甲状腺髓样癌的基因组和转录特征

 健明 2021-07-14

我在我在04-转录组笔记推文任务列表(半年期)里面安排了6个经典综述和10篇转录组应用文献给大家,可惜愿意沉下心了认真苦学的并不多。(https://share./doc/14uneHKvPg)

所以安排转录组讲师给大家做一下领读:

下面是转录组讲师的投稿

文章信息

标题:Genomic and Transcriptomic Characterization of Sporadic Medullary Thyroid Carcinoma

标题:散发性甲状腺髓样癌的基因组和转录特征

杂志:Thyroid(IF 5.227). 2020 Jul

作者:Qing-Hai Ji1,2(通讯)1 复旦大学上海肿瘤中心头颈外科;2 复旦大学上海医学院肿瘤学系;3 复旦大学上海肿瘤中心,复旦大学生物医学研究所医学表观遗传学与代谢重点实验室

背景知识

散发的甲状腺髓样癌,英文为:Sporadic medullary thyroid carcinoma,缩写MTC,是一种相对罕见的神经内分泌恶性肿瘤,由产生降钙素的旁淋巴细胞(c细胞)引起。MTC在所有甲状腺恶性肿瘤中占3-5%,但在甲状腺癌相关死亡中占近13%。**与分化良好的甲状腺癌比较,MTC在生物学上具有更强的侵袭性,可以增加广泛淋巴结转移和局部晚期侵袭的可能性。**此外,MTC对放射性碘或促甲状腺激素抑制没有反应,对放射治疗和常规细胞毒性化疗也不敏感,导致在晚期疾病的治疗有限。

摘要

背景散发性甲状腺髓样癌(MTC)是一种相对少见的神经内分泌恶性肿瘤,其散发性甲状腺髓样癌(sMTC)的分子肿瘤发生机制尚不完全清楚。在这项研究中,我们进行了一项聚焦于sMTC基因组和转录组特征的研究。

方法:纳入29例sMTC患者。对18名患者进行了全外显子组测序(WES),包括肿瘤样本和匹配的非癌组织。29例肿瘤均进行了全转录组测序(RNA-Seq)。分析WES、RNA-Seq和拷贝数改变(CNA)数据。采用细胞计数Kit-8 (CCK-8)检测细胞增殖。

结果

  • 在体细胞突变中,RET是唯一复发的癌症相关突变基因(5/18,27.8%)。

  • 在生殖细胞突变中,脂肪基因家族的两个成员FAT1和FAT4被确定为两个最常见的突变基因。

  • CNA分析发现,位于染色体4q上的FAT1和FAT4也是最常受体细胞染色体缺失影响的两个基因(4/18,22.2%)。

  • 使用TT和MZ-CRC-1细胞系,CCK-8检测结果显示,敲除FAT1和FAT4可促进MTC细胞增殖。

  • 基于基因表达谱,患者被聚集成两种分子亚型:间充质样亚型以上皮-间充质转化为特征,而增殖样亚型与细 周期通路的富集有关。

  • 大多数结构性复发(80%)发生在增殖样亚型中。

结论

  • 除了RET外,这些发现表明,在sMTC中,FAT1/FAT4基因组的改变也很常见。
  • 两种具有不同生物学行为的sMTC分子亚型被鉴定出来。但是,这些结果需要在未来更大的样本和更全面的实验来验证,特别是对于FAT1/FAT4种系变异的频率和功能。

数据和方法

1 病人样本和临床病理资料

29个病人,其中有18个病人有配对正常组织。是新鲜冷冻组织。见补充材料Table S1

2 Whole-exome sequencing

对18个病人的配对组织36例样本进行全外显子测序;150-bp paired-end reads;Illumina测序平台。

3 Alignment and variant calling
  • 数据过滤:FastQC

  • 参考基因组:GRCh37

  • 比对:BWA

  • GATK  :SNV  和Indel

  • 注释:ANNOVAR

  • identify SNVs and Indels 过滤条件:

    • (1) variants with a quality <30, a depth of coverage <20 in tumor or plasma samples, or <2 reads supporting the variant were filtered out;
    • (2) only variants within the exonic or splicing site were retained;
    • (3) variants reported in more than 1% of the population in the 1000 Genomes Project (1000gAUG_2015ALL) or the Exome Aggregation Consortium (ExAC_ALL) or the Genome Aggregation Database (gnomAD_ALL) in the East Asian population were discarded as they were regarded as singlenucleotide polymorphisms
    • (4) synonymous variants were excluded.
4 体细胞和生殖细胞突变识别

体细胞突变:评估每个变异的效应:SIFT  ,Polyphen2  ,MutationTaster  ,参数设置为软件默认

生殖细胞突变:InterVar database

5 CNV识别
6 通路相关的癌症基因突变
7 细胞培养和试剂
8 小干扰RNA转染和细胞计数Kit-8实验
9 RNA-Seq
  • The RNA quality :2100 bioanalyzer

  • Illumina sequencing platform;150-bp paired-end

  • 参考基因组:GRCh38;注释文件:GENCODE v29 annotation

  • 比对:STAR;定量:featureCounts

10 聚类
  • 数据:the top 1000 most variable genes  ,ConsensusClusterPlus

结果

1 由WES识别的突变
  • 数据:18对配对样本,肿瘤样本平均测序深度120X,癌旁样本150X。

  • 识别了癌症相关的48个体细胞突变:45个错义替换,1个无义突变,2个nonframeshift deletions

每个病人平均只有2.7个突变,比较低。

RET基因是唯一一个在两个以上的样本中出现突变的基因,突变情况如下图:p.C634R (n = 2), p.M918T (n = 1), p.A883F (n = 1), and p.C630G (n = 1)

  • 识别了203个生殖细胞突变,FAT1 (n = 4)  和FAT4 (n = 3)  两个肿瘤抑制基因,属于同一非典型钙粘蛋白超家族,是突变频率最高的基因。

突变详细情况:

此外,这三个基因的突变都由桑格测序得到了验证。

2 CNA  分析
  • 数据:上述18个病人的配对样本
  • 没有识别到生殖细胞突变
  • 在9例(50.0%)肿瘤样本中检测到31例体细胞群体基因拷贝数变异,涉及754个癌基因和抑癌基因
    • 最常见的体细胞变化包括4q染色体拷贝数损失(n = 4,22.2%)和1p染色体拷贝数损失(n = 4,22.2%)

结合WES和CNA结果,我们发现体细胞突变时间高度集中在the RTK/RAS pathway通路(包括RET, ERBB3, and the RasGAP gene family)和the Hippo pathway(包括including FAT1, FAT4, LATS2, and others)。

总体而言,50.0% (n = 9)的MTC样本在RTK/RAS信号轴上显示了体细胞SNVs或CNVs,而44.4% (n = 8)的样本显示Hippo通路基因的改变。

3 CCK-8 assay

采用TT细胞系和MZ-CRC-1细胞系,采用CCK-8法研究敲除FAT1和FAT4对MTC细胞增殖的影响。如上所述,与之前的研究(32)相似,虽然细胞被短暂转染,但由于两种细胞系的倍增时间延长,OD450值连续测量了5天。CCK-8结果显示,在TT和ms - crc -1细胞中,敲除FAT1和FAT4均能显著促进细胞增殖。

4 使用RNA-Seq数据进行分子分型
  • 数据29个肿瘤样本

转录组的标准分析,比较容易复现,基本上看我六年前的表达芯片的公共数据库挖掘系列推文即可;

非监督聚类将29个样本分成亚类,最佳聚类数为2。下图为热图展示的分成两类的结果。

然后,对这两个cluster做GSEA的cancer hallmark signatures基因集合分析。我们发现,上皮-间充质转化(EMT)基因集在Cluster 1中富集,而MYC靶标V1在Cluster 2中富集程度较高。cluster1和Cluster 2分别被称为间充质样亚型增殖样亚型,分别以EMT和增殖活性增强为特征。

我们进一步评估了这两种分子亚型的临床相关性。

此外,我们还发现:cluster1的15个病人中,只有一个病人在随访期间出现了structural recurrence,大多数 structural recurrence events (4/5, 80%)  出现在14  cluster2病人组中。

总结

问题1:转录组(GRCh38)和基因组(GRCh37)的数据分析没有使用同一个参考基因组没有问题么?后面通过gene symbol将两个层面的数据联系起来?我没有比较过两个版本的基因组数据的差别,欢迎讨论。

文章的创新点:散发的甲状腺髓样癌算是一个稀有癌种,基础研究相对少。整个文章思路还是很清楚的,就是两个测序,做了一些基本的分子层面的特征刻画。但是文章的样本数相对来说有点少了,看突变频率有点失真。

文末友情推荐

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多