分享

实用干货 | 单细胞与空间转录组联合,实现“1+1>2”!

 老学究ev2fmzu9 2024-03-25 发布于江苏

组织器官是由众多细胞类型组成,这些类型的细胞大小形态、基因表达、空间位置都各不相同,但相互之间时刻都进行着紧密的细胞通讯,且与发挥的功能密不可分。单细胞转录组测序技术(scRNA-seq)的出现,使我们可以精准的识别每种细胞亚型、每个细胞的基因表达情况,但是缺少空间位置信息。而空间转录组测序技术(ST RNA-seq)可以同时提供空间位置信息和基因表达信息,但目前的检测精准度还达不到单细胞水平。

于是衍生出一个热门的研究方向:单细胞与空间转录组联合分析,实现“1+1>2”的效果。那么本期文章讨论二者应该如何联合呢?

联合之后又能解决什么问题?敬请期待下期文章!

单细胞与空间转录组数据联合方式

单细胞和空间转录组数据联合分析将有助于理解细胞类型分布的结构以及构成这种结构的细胞间通讯。目前已经发表的两种数据联合算法有很多,根据数据联合策略的不同可以将这些算法分为两种主要的方式:去卷积(Deconvolution)和映射(Mapping)。

去卷积

 去卷积旨在根据单细胞数据,从每个捕获点(spot)mRNA转录物的混合物中分离出离散的细胞亚群。其输入是单细胞数据和空间转录组数据,输出是每个spot点内不同细胞类型所占的比例及每类细胞个数,该类方法包括:SPOTlight、cell2location、MIA、stereoscope、SpatialDWLS及Robust cell-type decomposition(RCTD)。

 映射

映射的基本思路是以单细胞分辨率创建空间分辨率的细胞类型映射,主要见于单细胞转录组与基于原位技术的空间转录组(High-plex RNA imaging,HPRI)联合分析。映射分析是对探针得出的某部分组织的转录本数据和单细胞数据进行共聚类或最近邻回归,得到某个区域中最可能的细胞类型或不同细胞类型的概率饼图,该类方法包括pciSeq,Harmony,LIGER,Seurat等。

反卷积和映射这两种方法之间,并不存在清晰的分界线。前者关注每个空间中spot点的情况,后者则是全局的进行分析。从使用的统计模型,可以将单细胞和空间转录组整合的方法分为以下四种,分别是基于回归的、基于概率模型的、通过相对聚集程度计算得分的和基于后聚类的方法,每种方法越来越倚重整个切片的全局信息,而不是对每个spot进行独立地判定。

表1 单细胞与空间转录组数据联合方式汇总

1、多模式相交分析(MIA)

多模式相交分析(MIA)的方法计算了空间转录组的区域差异基因与单细胞转录组鉴定的细胞类型的marker基因之间的重叠关系,使用超几何分布推断特定组织区域中特定细胞类型的富集程度,以所有基因为背景计算P值来表示。

原理:Background为单细胞与ST数据共同表达的基因集,找到单细胞数据中的CellMarkers基因集和非maker基因集,然后将ST的SpotMarkers分别与这两个区域取交集,如果SpotMarkers多集中于蓝色区域,则认为CellMarkers与SpotMarkers是显著重叠的,即推断出SpotCluster属于这个细胞类型的可能性越高。

简单的来说就是,看一个spot点高表达的基因和某一细胞类型高表达的基因是否有足够多的重叠,重叠的多的就认为该区域为这一细胞类型。

2、SPOTlight

SPOTlight是一种基于种子的非负矩阵因子分解回归算法的反卷积算法。最初该算法是专门为空间数据开发的,经过优化后SPOTlight能够将空间与单细胞转录组数据集成在一起,从而推断出每个spot中的细胞类型和比例。

应用场景:Spatial decomposition(空间分解)

算法:Seeded NMF regression(基于种子的非负矩阵因子分解回归)

优点:跨多个组织的高精度

缺点:没有将捕获的位置信息合并到模型空间分解中

原理:SPOTlight新添加了先验信息,用细胞类型标记基因初始化基准矩阵和系数矩阵,从而大大提高了灵敏度和准确性。同时,依赖于非负最小二乘(NNLS)来填充捕获位置的系数矩阵以及确定spot点的细胞组成。随后解卷积空间捕获的位置信息。

3、Stereoscope

该模型框架利用单细胞数据推断空间数据中每个捕获位置的每个细胞类型的比例估计,从而消除了对空间数据分析时对要素或簇等抽象实体的任何解释或注释的必要性。

应用场景:Spatial decomposition(空间分解)

算法:Negative binomial distribution with MAP(具有最大后验概率的负二项分布)

优点:利用完整的表达谱而不是选定的标记基因来实现更高的准确性

缺点:需要更深的测序深度                                     

原理:首先使用单细胞数据来描述每个细胞类型的表达谱,然后在每个捕获位置内找到这些类型的组合,以最好地解释空间数据

4、cell2location

cell2location是一种基于分层贝叶斯框架开发的,用于解析空间转录组数据中细粒度细胞类型,并创建不同组织的综合细胞图。

应用场景:1. Spatial location reconstruction for scRNA-seq data(scRNA-seq数据的空间位置重建);2. Spatial decomposition(空间分解)

算法:Hierarchical Bayesian framework(层次贝叶斯框架)

优点:能够推断每个捕获位置每种细胞类型的细胞绝对数量

缺点:用户通常不知道要预先指定的超参数

原理:首先,从scRNA-seq数据中提取参考细胞类型的特征信息,然后利用这些特征信息和一个或多个空间转录组数据集作为输入,将单个spot点的mRNA信息分解为不同的参考细胞类型。

参考文献

[1] Longo SK, Guo MG, Ji AL, Khavari PA. Integrating single-cell and spatial transcriptomics to elucidate intercellular tissue dynamics. Nat Rev Genet. 2021 Oct;22(10):627-644.

[2] Moncada R, Barkley D, Wagner F, Chiodin M, Devlin JC, Baron M, Hajdu CH, Simeone DM, Yanai I. Integrating microarray-based spatial transcriptomics and single-cell RNA-seq reveals tissue architecture in pancreatic ductal adenocarcinomas. Nat Biotechnol. 2020 Mar;38(3):333-342.

[3] Elosua-Bayes M, Nieto P, Mereu E, Gut I, Heyn H. SPOTlight: seeded NMF regression to deconvolute spatial transcriptomics spots with single-cell transcriptomes. Nucleic Acids Res. 2021 May 21;49(9):e50.

[4] Andersson A, Bergenstråhle J, Asp M, Bergenstråhle L, Jurek A, Fernández Navarro J, Lundeberg J. Single-cell and spatial transcriptomics enables probabilistic inference of cell type topography. Commun Biol. 2020 Oct 9;3(1):565.

[5] Kleshchevnikov V, Shmatko A, Dann E, Aivazidis A, King HW, Li T, Elmentaite R, Lomakin A, Kedlian V, Gayoso A, Jain MS, Park JS, Ramona L, Tuck E, Arutyunyan A, Vento-Tormo R, Gerstung M, James L, Stegle O, Bayraktar OA. Cell2location maps fine-grained cell types in spatial transcriptomics. Nat Biotechnol. 2022 May;40(5):661-671.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多