参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。但是也有不少文章是抓住stromal 里面的fibo 和endo进行细分,并且编造生物学故事的。而且这些亚群都可以继续细分:
所以,理论上只需要你对具体的细胞亚群生物学背景足够,加上有一点点单细胞转录组数据处理能力,很容易把多个数据集的同一个单细胞亚群汇总成为一个数据挖掘文章。如果是早期做这样的汇总,可以是CNS级别的文章,比如张泽民课题组就发了2个:
现在已经是2023了,同样的思路发CNS有点难度,但是可以退而求其次,所以有了CNS子刊思路大放送,希望对大家有帮助。 多个癌症的成纤维单细胞亚群Nature Communications | (2022)的文章:《Pan-cancer single-cell analysis reveals the heterogeneity and plasticity of cancer- associated fibroblasts in the tumor microenvironment 》 纳入了10个常见的实体瘤的单细胞转录组癌症的12个数据集,共164个人的226个单细胞转录组样品,分别是:
这226个样品的细胞数量总计是855,271 cells ,简单的降维聚类分群后,除去上皮细胞后的肿瘤微环境细胞是569,759 cells ,可以划分为下面的5大亚群:
如下所示的第一层次降维聚类分群以及不同单细胞亚群比例情况展示图: 多个癌症的肿瘤浸润CD8的T细胞Riegel et al., 2023, Molecular Cell 文章:《Integrated single-cell profiling dissects cell-state-specific enhancer landscapes of human tumor-infiltrating CD8+ T cells》 包含的单细胞转录组数据集主要是:
处理这些数据集后:We removed all but conventional CD8+ cells, filtered low-quality cells, and clustered the remaining 38,356 CD8+ human T cells 对这 38,356 CD8+ human T cells 进行降维聚类分群后,主要的分群和生物学注释是:
可以看到,细分CD8+ 的T细胞很难有泾渭分明的效果,如下所示: 肺癌多个数据集的中性粒细胞文章:《High-resolution single-cell atlas reveals diversity and plasticity of tissue-resident neutrophils in non- small cell lung cancer》 数据量是:1,283,972 single cells from 556 samples and 318 patients across 29 datasets 分组是:232 patients with NSCLC and 86 non-cancer controls. 很清晰的思路,就是关心:tumor-associated neutrophils (TANs) and normal adjacent tissue-associated neutrophils (NANs). 全部的一百多万个单细胞进行第一层次分群:
基因列表主要是针对肿瘤单细胞的第一层次降维聚类分群 , 是:
参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。 值得注意的是虽然本文重点是neutrophils,但其实还不到一万个neutrophils细胞,而且 neutrophil cluster (FCGR3B, CSF3R, CXCR2, and G0S2) comprised 8,468 cells with overt low mRNA counts. 第一层次和第二层次降维聚类分群如下所示: 具体的分析主要是凑图选定了癌症组合,每个癌症都有十几个单细胞数据集可供挑选,汇总后可以从里面挑选自己有把握的单细胞亚群看看它在不同癌症不同数据集有什么比例差异。细分后的亚群可以使用排前面的特异性高表达基因命名,然后各种go,kegg等生物学功能数据库注释,最后就是单细胞高级分析3件套走起(拟时序,转录因子,细胞通讯),最后上升到肿瘤预后方面继续凑一个临床预后模型就大功告成啦。 加油,希望这些cns小辣鸡有你一份。 |
|