分享

图解组学| 1.UMAP或tSNE降维聚类(再不上车,你就真的错过了!)

 新用户4064dVjo 2023-07-22 发布于北京

大数据的出现与普及深刻地影响到了多个领域,包括医学科研领域,其中的一个经典代表就是组学,这也是我们本系列的主角,包括Bulk组学(基因组、转录组、蛋白质组、代谢组等)、单细胞组学、空间组学。

我们将先从单细胞组学说起,带大家一起从多个维度去解析相关细节,坚持学习完这个系列,不敢保证你可以成为组学领域的专家,但是可以保证你绝不再是组学领域的小白。

话不多说,我们开始发车啦~

单细胞转录组测序(Single cell RNA sequencing, scRNA-seq)是将分离的单个细胞的转录组RNA进行扩增后进行高通量测序的一项新技术。与传统的bulk RNA-seq相比,scRNA-seq的一个突出优势是识别和表征样本中的异质细胞群,例如心脏组织中不同的细胞类型,如心肌细胞、内皮细胞、成纤维细胞和免疫细胞,以及相同细胞类型的不同功能状态,如心室、心房或起搏性心肌细胞,或血管生成与静止内皮细胞。

      对于scRNA-seq高维数据(成千上万不同细胞×每个细胞测到的上千个基因),通常使用UMAP或tSNE的降维聚类方式处理,UMAP或tSNE图也是scRNA-seq的重要可视化形式,图中每一个点代表一个细胞,基因表达相近的细胞相互靠近,聚在一簇,进而通过簇表达的差异基因确认其是否代表生物学相关或正确的细胞类型或状态。

UMAP和tSNE在计算高维距离、信息损失等方面有所区别,简单理解:UMAP簇和簇之间的距离可以反映相似程度,而tSNE相距较远的簇也可能是同一细胞类群(如上图)。此外,UMAP处理速度耗时更短,结果稳定性更高,故目前更多使用UMAP作为降维聚类方式。         

参考文献:Becht E, McInnes L, Healy J, Dutertre CA, Kwok IWH, Ng LG, Ginhoux F, Newell EW. Dimensionality reduction for visualizing single-cell data using UMAP. Nat Biotechnol. 2018 Dec 3.

写在最后

“Meddingguan”是由一群北京协和医学院(清华大学医学部)的博士开创的公众号,初心是让医学科研有迹可循,帮助一线的医学科研人员更快地成长,希望大家支持与关注!

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多