分享

拟时序分析的10个步骤

 健明 2021-07-14

最近刷了刷植物领域单细胞文献,有一个蛮早期的拟南芥根部单细胞研究:《High-Throughput Single-Cell Transcriptome Profiling of Plant Cell Types》对拟时序分析描述的很清楚,适合做科普!

首先当然是对原始单细胞转录组表达量矩阵的降维聚类分群啦,这个在前面的例子:人人都能学会的单细胞聚类分群注释  ,我们演示了第一层次的分群。本文是植物学,但是原理是类似的,只不过不同细胞亚群的标记基因不一样。

降维聚类分群

然后你需要有背景知识才能做 拟时序分析 :文章是这样描述:focusing on endodermal cells, which have a known trajectory from undifferentiated, to state I (defined by the formation the Casparian strip), to state II (defined by the formation of a secondary cell wall made of suberin) (Andersen et al., 2015)

参考文献也列的明明白白,可以看到 发育顺序如下所示,从undifferentiated 到state I 然后到state II,这个背景知识决定了你要不要做拟时序分析,已经针对哪部分细胞亚群进行拟时序分析哦!

已知的发育顺序

然后你需要提取指定单细胞亚群去运行拟时序分析,最经典的软件工具当然是monocle啦 ,代码超级简单,我们在《单细胞天地》公众号也多次分享过,而且三年前的我们一个单细胞公开课就是重点讲解这个代码:「生信技能树」使用Smart-seq2单细胞转录组数据探索小鼠性腺发育,链接是:https://www.bilibili.com/video/BV1454y1q77Z

运行结果如下所示:

可以看到,有两个发育分支,接下来就可以展现一下重要的基因,在拟时序的两个分支上面:

 

然后是拟时序的的各自特征基因的生物学功能数据库注释

这一套图表的代码也是在「生信技能树」使用Smart-seq2单细胞转录组数据探索小鼠性腺发育,链接是:https://www.bilibili.com/video/BV1454y1q77Z ,学完了就能做出来哦!

 

总结一下这10个步骤:

  • 降维聚类分群
  • 提取指定单细胞亚群
  • 运行monocle
  • 判断拟时序分析推断好的发育轨迹
  • 随着轨迹变化的基因获取
  • 获取的基因的生物学功能数据库注释
  • 还有四个步骤在这个文章里面并没有体现,这里略

拟时序分析是否可以对全部单细胞亚群呢?

发育生物学有这样的操作,比如:

  • 2019年的Nature文章"The single-cell transcriptional landscape of mammalian organogenesis"的使用Monocle鉴别出了数百种细胞类型和56条细胞发育轨迹,并定义了数千个相应的标记基因。
  • 2019年的Science 文章 "A lineage-resolved molecular atlas of C. elegans embryogenesis at single-cell resolution",确定了502种不同的末端和前末端细胞类型,这些细胞类型分别对应1068个细胞谱系分支。

如果你对单细胞数据分析还没有基础认知,可以看基础10讲:

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章