分享

专家点评Nature | 第二版“癌细胞系百科全书”正式发布

 生物_医药_科研 2019-05-29

自上世纪五十年代初首个人类癌细胞系HeLa诞生以来,这种具有稳定遗传背景和无限繁殖能力的临床前(pre-clinical)肿瘤模型一直都是生物医学的主要实验对象之一。尽管癌细胞系并不能百分之百还原真实肿瘤环境,在部分情形下甚至存在显著差异,但其在DNA突变、基因表达、表观遗传特征等方面的多样性还是为研究人员在不同背景下研究肿瘤发生发展的机制及开发相应的精准疗法做出了巨大贡献【1】

图片引自:https://www./news/writing-book-cancer-knowledge

为了深入并准确地刻画癌细胞系的遗传特征,来自美国Broad研究所、Dana-Farber癌症研究所和Novartis生物医学研究所的多个课题组于2012年合作完成了“癌细胞系百科全书(Cancer Cell LineEncyclopedia, CCLE计划,对覆盖三十多种组织来源的947种人类癌细胞系进行了大规模深度测序,整合了DNA突变、基因表达和染色体拷贝数等遗传信息【2】。该数据库在向公众开放的七年时间里,已经成为癌症基因组学的标准参考数据库之一:原始论文迄今已被引用约3500次,而仅在2017年9月至今的19个月里就有来自全世界129个国家的88000名用户访问了该数据库。

随着多组学测序技术和癌症精准医学向纵深发展,CCLE数据库也不断在癌细胞系数量和测序信息维度等方向上进行着更新。2019年5月9日,CCLE项目组在Nature上发表长文Next-generation characterization ofthe Cancer Cell Line Encyclopedia,报道了癌细胞系百科全书的重大更新。

在之前已有的DNA突变、基因表达和染色体拷贝数信息之外,CCLE项目人员对1000余种癌细胞系做了以下几个方面的全新大规模分析(下图):1)对899种癌细胞系的213类蛋白质进行了基于反向蛋白质阵列(reverse-phase protein array, RPPA的定量分析;2)对1019种癌细胞系进行了基于深度RNA测序(RNA-sequencing)的基因表达和可变剪切定量分析;3)对326种癌细胞系进行了全外显子测序(whole-exomesequencing, WES和对329种癌细胞系进行了全基因组测序(whole-genome sequencing);4)对843种癌细胞系进行了基于简化重亚硫酸盐测序(reduced representation bisulfide sequencing, RRBS的启动子甲基化水平定量分析;5)对954种癌细胞系进行了miRNA表达定量分析;6)对897种癌细胞系进行了组蛋白修饰水平定量分析;7)对928种癌细胞系的225类代谢物进行了定量分析。

第二版癌细胞系百科全书的发布使研究人员除了能更全面详细地了解癌细胞系本身的遗传特征之外,更重要的是能够从多组学和基因调控多层次的角度深入研究这些特征与肿瘤对特定基因的依赖程度和对药物治疗的反应性等表型之间的关联。利用同样由前述三个研究机构发表的癌症依赖性图谱数据库(Cancer Dependency Map),探究单基因敲降或敲除对癌细胞增殖的影响,从而表征基因必要性(essentiality)【3-5】研究人员着重解析了全新的癌细胞系多组学特征对其基因依赖性的影响,从中发掘出的新抑癌机制将可能转化为精准治疗的靶标。

启动子甲基化作为一类主要的表观遗传调控机制,与癌症基因的异常表达具有相当程度的关联【6】。在该项研究中,研究人员分析了基因的启动子甲基化水平与某种癌细胞系对其依赖性的相关程度,发现多个组织特异转录因子的启动子甲基化水平与癌症依赖性显著负相关(下图a)。例如,转录因子SOX10几乎只在黑色素瘤(melanoma)中具有极低的启动子甲基化水平和较高的基因表达水平(下图b),而这正好对应了黑色素瘤细胞系对SOX10的强依赖性(下图c);相反,在由启动子高甲基化导致的SOX10表达极低的细胞系中,对其进行敲除几乎不影响细胞增殖水平。这一结果从启动子甲基化水平的角度令人信服地解释了基因表达水平决定基因必要性的机制。

与启动子甲基化类似,组蛋白修饰也是一类重要的基因表达表观调控机制,且在肿瘤发生过程中扮演重要角色【7】。因此,研究人员分析了不同癌细胞系之间的组蛋白修饰差异并试图解释导致这种差异的原因。利用聚类分析方法,研究人员发现具有类似组蛋白修饰特征的癌细胞系往往亦共享同一类表观遗传调控因子的突变特征。例如,研究人员找到了一个具有高水平H3K18和H3K27乙酰化的癌细胞系群,而这些细胞系中的乙酰转移酶EP300或CREBBP几乎都具有截短突变(truncating mutation),暗示了与前者的紧密关联。这一结果展示了对表观遗传信息的系统性描绘有助于理解表观调控因子本身异常所引起的功能性后果。

在基因表达的转录后调控机制中,可变剪切(alternative splicing)无疑是一个关键步骤,其导致的RNA稳定性异常、翻译功能异常及翻译产物异常等变化在肿瘤发生过程中均具有显著推动作用【8】。同一基因在不同癌细胞系中的不同剪切模式可能影响了相应癌症类型对这一基因的依赖程度。为了识别具有这一特征的基因,研究人员检查了基因外显子保留率(exon inclusion rate,具有某一特定外显子的转录本在所有转录本中的比例)和基因表达水平分别与基因必要性的相关程度,发现p53负调控蛋白的编码基因MDM4的外显子保留率与其在癌细胞系中的被依赖程度高度正相关,而其基因表达水平却不存在这种特征(下图左)。为了探究MDM4的这一剪切——依赖关联是否与其对p53的负调控效应有关,研究人员比较了p53野生型与p53突变型癌细胞系中MDM4剪切模式对其必要性的影响,结果发现MDM4的6号外显子丢失使其失去肿瘤依赖性的效应仅在具有正常p53的癌细胞中存在(下图右)将RNA可变剪切纳入癌细胞系百科全书无疑增强了对肿瘤发生机制的理解。

最后,研究人员还分析了基于RPPA的200多种蛋白表达水平的直接定量在分析基因必要性上的意义。研究人员首先观察到尽管RNA水平与蛋白水平的相关性总体上较高,但在部分癌细胞系中两者关联相当有限(下图左),这表明利用RNA表达水平与基因必要性做关联分析可能导致较高的错误率。当研究人员比较蛋白水平和RNA水平两者与基因必要性相关程度的差异时,发现SHP2等基因的蛋白水平与其必要性显著正相关,而RNA水平则无此效应(下图右)。这一结果表明,对部分基因来说通过其RNA表达水平间接推测蛋白表达水平不仅可能产生非常大的结果误差,更重要的是可能对下游功能性分析造成误导。

 

总之,CCLE对上千种癌细胞系的多组学图谱深度解析、对海量数据的开放共享、与外延的多类数据库的联合分析,为癌症基因组学和癌症精准治疗的发展做出了巨大贡献,是生物医学领域内不可多得的宝贵资源。

专家点评

梁晗(美国德州MD  Anderson癌症中心)

癌症是一组高度异质性的疾病。这种异质性不仅体现在不同癌种之间,也体现在同一种癌症不同病人的肿瘤之间。精准癌症医学的核心就是通过病人肿瘤的分子特征来确定个体化最优的治疗方案。历时10年完成的癌症基因组图谱(The Cancer Genome Atlas, TCGA通过高通量的组学技术对33种癌症类型的 >11000病人的肿瘤进行了最全面的分子描述,从而为精准治疗提供了一个丰富的知识宝库。 5月9日的《自然》发布了癌症细胞系的新一代百科全书(the Cancer Cell Line Encyclopedia, CCLE,在以往的分子数据的基础上,对>1000个细胞系又全面地更新了遗传突变, RNA 剪接, DNA甲基化,组蛋白修饰, microRNA  表达和蛋白质表达的数据。这个资源与癌症基因组图谱高度互补,为研究癌症机理和精准医学实施又添一个关键利器。

CCLE 对于临床转化的意义在于以下几点。首先,TCGA代表在病人肿瘤中发现的分子特征和规律,具有直接的临床意义,但是在高维度,大样本的病人组学数据中寻找有意义的分子规律犹如大海捞针,容易受到样本偏见和肿瘤纯度等因素的影响,而具有广泛多样的CCLE 细胞系组学数据提供了一个独立的验证集,可以帮助确定所发现分子规律的可靠性和优先级。第二,病人肿瘤中的规律大多是分子特征之间的相关性,但相关性不一定代表直接的因果关系和分子相互作用。而癌症细胞系却可通过实验手段定向干扰某一分子特征,从而直接研究不同分子或同一分子不同层面调控之间的因果关系,这对深入研究癌症机理是至关重要的。新一代CCLE提供的丰富分子数据可极大帮助科研人员选择合适的模式细胞系对所关心的问题进行下游研究。第三,癌症病人的治疗过程唯一且不可逆,所以积累的临床数据相对有限,而CCLE  的细胞系大多具有广泛的药物敏感数据,基因抑止或基因敲除的细胞反应数据,从而积累了丰富的表型组,这就为系统化研究分子和表型之间的关系提供了一个绝佳的“实验场”。值得注意的一点是,虽然TCGA 和CCLE 涵盖的组学数据种类大体相同,但它们所用的高通量平台有些是不同的,比如microRNA 表达和甲基化,这样在用两者数据进行综合分析时,要特别注意这些因测量平台不同而带来的一些技术偏差。总之,新一代CCLE 的数据宝库将极大地加速分子标识指导下的临床转化,从而为精准癌症医学提供巨大助力。

原文链接:

https:///10.1038/s41586-019-1186-3

制版人:小娴子

参考文献


1. Gillet, J. P., Varma, S.& Gottesman, M. M. The clinical relevance of cancer cell lines. Journalof the National Cancer Institute (2013). doi:10.1093/jnci/djt007

2. Barretina, J. et al.The Cancer Cell Line Encyclopedia enables predictive modelling of anticancerdrug sensitivity. Nature 483, 603–7 (2012).

3. Tsherniak, A. et al.Defining a Cancer Dependency Map. Cell 170, 564-576.e16 (2017).

4. McDonald, E. R. et al.Project DRIVE: A Compendium of Cancer Dependencies and Synthetic LethalRelationships Uncovered by Large-Scale, Deep RNAi Screening. Cell 170,577-592.e10 (2017).

5. Meyers, R. M. et al.Computational correction of copy number effect improves specificity ofCRISPR-Cas9 essentiality screens in cancer cells. Nat. Genet. 49,1779–1784 (2017).

6. Taberlay, P. C. &Jones, P. A. DNA methylation and cancer. Prog. Drug Res. (2011).doi:10.1007/978-3-7643-8989-5_1

7. Esteller, M. Cancerepigenomics: DNA methylomes and histone-modification maps. Nature ReviewsGenetics (2007). doi:10.1038/nrg2005

8. Oltean, S. & Bates, D.O. Hallmarks of alternative splicing in cancer. Oncogene (2014).doi:10.1038/onc.2013.533

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多