分享

冉冉升起的单细胞新聚类方法

 微笑如酒 2019-03-20

Hello又跟大家见面了,这次给大家带来的文献解读是关于使用一致性聚类方法从单细胞RNA-seq数据识别癌症亚型(Identification of cancer subtypes from single-cell RNA-seq data using a consensus clustering method)。人类癌症是由那些具有不同分子特征的细胞组成的复杂生态系统,肿瘤内异质性的特征对精确癌症治疗来说至关重要。而scRNA-seq(单细胞RNA测序)可以量化不同细胞群的表达,进而能够分析细胞之间的差异,单细胞表达数据的聚类也能为从大量异质细胞中识别细胞类型提供直观的方法。

文章主要讲的是作者提出了一种无监督的一致聚类方法——conCluster,用于从单细胞RNA-seq数据中识别癌症亚型。简单来说,conCluster首先使用具有不同初始参数的tSNE(一种高维数据降维的算法) + K均值聚类获得一组基本分区,然后将这些不同的分区融合到一致簇中。为了验证该方法的稳定性,还将conCluster应用于真正的癌症scRNA -seq数据集,然后构建已识别的癌症亚型的共表达网络以分析其差异。

conCluster模型是怎么构建的呢?第一步是筛选基因,我们的重点是关注肿瘤细胞的内在转录组学特征,由于稀有和普遍存在的基因通常不适用于聚类,因此需要过滤掉这些基因。接下来,通过控制平均表达和变异之间的关系,识别在这些单细胞中变异最大的一组基因;第二步是使用t-SNE降维,scRNA-seq数据集噪声大,维度高,为了进一步降低维数,作者使用t-SNE将经过筛选的scRNA表达数据降为二维;第三步是划分细胞,基于变换的二维数据矩阵,用不同的初始参数多次执行K均值聚类,来获得这些单个细胞的不同基本分区;第四步是进行一致性聚类,在获得不同的分区之后,将所有二进制矩阵连接成更大的二进制矩阵并执行K均值聚类,其中CH指标来确定聚类的数量,CH指标由分离度与紧密度的比值得到,以判断聚类结果的性能,最后将每个聚类结果融合成一个一致的结果。值得注意的是,当数据集中有细胞标签时,可使用调整兰德指数(ARI)来衡量聚类的准确性。

单细胞RNA-seq数据的性能评估

为了全面评估性能,作者将conCluster与五种广泛使用的scRNA-seq数据聚类方法进行了比较,包括谱聚类,tSNE + K均值,SNN-Cliq,CIDR和SC3(如果想简单了解一下这五种聚类方法的朋友,文末尾有彩蛋)。下图显示了通过ARI测量的不同算法的聚类性能,对于具有6个簇的单细胞表达数据数据集GSE73727,当簇数目接近6时,这些方法可以获得更好的性能;对于具有2个簇的数据集GSE72056,当k等于2时,性能最佳。总体而言,conCluster更能准确地识别这些单个细胞的亚型,当ARI接近于0.9时,这两个数据集中的conCluster比其他方法的性能都要好。

癌症亚型的识别

此外,作者对GSE72056中的恶性黑素瘤肿瘤细胞应用了conCluster和另外五种方法。如图中所示,conCluster比其它的方法呈现出五个更清晰可识别的簇,SNN-cliq,tSNE + K均值和SC3也能得到相对清晰的簇,而谱聚类和CIDR在区分这些簇方面表现不足。

接下来,为了识别恶性黑素瘤的每个亚型的调控基因,作者进行了基因共表达网络分析。首先识别出细胞间有显著表达差异的基因,这些基因被用来重建亚型特异性共表达网络,并识别出一些高共表达基因的模块,利用WGCNA构建共表达模块。图中显示了每种黑素瘤亚型的共表达网络,不同的亚型包括不同的共表达基因子集,这些具有最高连接度的基因通常被认为是基本功能信号传导通路所需的驱动因子。

作者还计算了不同黑素瘤亚型的共表达网络中每个基因的网络程度,并识别了具有最多连接的基因。为了检验这些基因的潜在功能,使用DAVID工具进行了GO富集分析,并获得了关键的生物学过程和通路。总体来说,这些模块显著富集到了与黑素瘤相关的生物学重要过程,包括光刺激反应,抗原加工和细胞死亡调控等。

彩蛋:谱聚类是一种有效的传统聚类方法;tSNE + K均值是K均值聚类与非线性降维技术tSNE相结合的聚类方法;SNN-Cliq采用共享最近邻法来计算细胞之间的相似性,并使用图论理论模型执行单细胞聚类;CIDR使用插补方法以原则性方式减轻scRNA-seq数据中丢失的影响;SC3将单个K均值聚类的细胞-细胞之间的距离矩阵转换为一致的分区。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多