分享

CNS子刊思路大放送

 健明 2023-01-23 发布于广东

做单细胞转录组数据分析的时候,我给大家准备的基因列表主要是针对肿瘤单细胞的第一层次降维聚类分群 ,如下所示:

  • immune (CD45+,PTPRC),
  • epithelial/cancer (EpCAM+,EPCAM),
  • stromal (CD10+,MME,fibo or CD31+,PECAM1,endo)

参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。但是也有不少文章是抓住stromal 里面的fibo 和endo进行细分,并且编造生物学故事的。而且这些亚群都可以继续细分:

所以,理论上只需要你对具体的细胞亚群生物学背景足够,加上有一点点单细胞转录组数据处理能力,很容易把多个数据集的同一个单细胞亚群汇总成为一个数据挖掘文章。如果是早期做这样的汇总,可以是CNS级别的文章,比如张泽民课题组就发了2个:

  • 2021的cell文章:《A pan-cancer single-cell transcriptional atlas of tumor infiltrating myeloid cells》
  • 2021的science文章:《Pan-cancer single-cell landscape of tumor-infiltrating T cells》

现在已经是2023了,同样的思路发CNS有点难度,但是可以退而求其次,所以有了CNS子刊思路大放送,希望对大家有帮助。

多个癌症的成纤维单细胞亚群

Nature Communications | (2022)的文章:《Pan-cancer single-cell analysis reveals the heterogeneity and plasticity of cancer- associated fibroblasts in the tumor microenvironment 》

纳入了10个常见的实体瘤的单细胞转录组癌症的12个数据集,共164个人的226个单细胞转录组样品,分别是:

  • 148 primary tumor,
  • 53 adjacent,
  • 25 normal samples

这226个样品的细胞数量总计是855,271 cells ,简单的降维聚类分群后,除去上皮细胞后的肿瘤微环境细胞是569,759 cells ,可以划分为下面的5大亚群:

  • fibroblasts (c1-c8, DCN, COL1A1),
  • lymphocytes (c9-c17, CD3D, CD3E),
  • myeloid cells (c18-c24, CD68, CD14),
  • endothelial cells (c25-c28, VWF, PECAM1),
  • plasma cells (c29-c34, IGHG1, JCHAIN)

如下所示的第一层次降维聚类分群以及不同单细胞亚群比例情况展示图:

第一层次降维聚类分群以及不同单细胞亚群比例情况

多个癌症的肿瘤浸润CD8的T细胞

Riegel et al., 2023, Molecular Cell 文章:《Integrated single-cell profiling dissects cell-state-specific enhancer landscapes of human tumor-infiltrating CD8+ T cells》

包含的单细胞转录组数据集主要是:

HNSCC scRNA-seq data Cillo et al.36 NCBI GEO: GSE139324
PBMC scRNA-seq data Szabo et al.38 NCBI GEO: GSE126030
HCC scRNA-seq data Ma et al.35 NCBI GEO: GSE125449
BCC scRNA-seq data Yost et al.34 NCBI GEO: GSE123813
SCC scRNA-seq data Yost et al.34 NCBI GEO: GSE123813
RCC scRNA-seq data Young et al.37 Data S1 of the publication (https://www./doi/suppl/10.1126/science.aat1699/suppl_file/aat1699_datas1.gz.zip)

处理这些数据集后:We removed all but conventional CD8+ cells, filtered low-quality cells, and clustered the remaining 38,356 CD8+ human T cells

对这 38,356 CD8+ human T cells 进行降维聚类分群后,主要的分群和生物学注释是:

  • cluster 1 (e.g., CX3CR1, FGFBP2, FCGR3A, KLF2/3, TBX21).
  • Clusters 2 and 5 contained naive and memory markers (IL7R, CCR7, TCF7),
  • cluster 6 represented cycling cells (MKI67).
  • cluster 7 we found genes involved in antiviral responses and strong IFN signaling (e.g., ISG15, MX1, IFIT3),
  • Cluster 3 expressed exhaustion markers (e.g., TOX, ENTPD1, HAVCR2, PDCD1, LAYN),
  • the adjacent cluster 0 pre-TEX marker genes (CXCR5, TCF7, CD27, GZMK).

可以看到,细分CD8+ 的T细胞很难有泾渭分明的效果,如下所示:

很难有泾渭分明的效果

肺癌多个数据集的中性粒细胞

文章:《High-resolution single-cell atlas reveals diversity and plasticity of tissue-resident neutrophils in non- small cell lung cancer》

数据量是:1,283,972 single cells from 556 samples and 318 patients across 29 datasets

分组是:232 patients with NSCLC and 86 non-cancer controls.

很清晰的思路,就是关心:tumor-associated neutrophils (TANs) and normal adjacent tissue-associated neutrophils (NANs).

全部的一百多万个单细胞进行第一层次分群:

  • 169,223 epithelial cells, (其中一半是恶性肿瘤细胞)
  • 670,409 immune cells, (里面的中性粒细胞非常稀少)
  • 58,790 stromal and endothelial cells

基因列表主要是针对肿瘤单细胞的第一层次降维聚类分群 , 是:

  • immune (CD45+,PTPRC),
  • epithelial/cancer (EpCAM+,EPCAM),
  • stromal (CD10+,MME,fibo or CD31+,PECAM1,endo)

参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。

值得注意的是虽然本文重点是neutrophils,但其实还不到一万个neutrophils细胞,而且 neutrophil cluster (FCGR3B, CSF3R, CXCR2, and G0S2) comprised 8,468 cells with overt low mRNA counts.

第一层次和第二层次降维聚类分群如下所示:

第一层次和第二层次降维聚类分群

具体的分析主要是凑图

选定了癌症组合,每个癌症都有十几个单细胞数据集可供挑选,汇总后可以从里面挑选自己有把握的单细胞亚群看看它在不同癌症不同数据集有什么比例差异。细分后的亚群可以使用排前面的特异性高表达基因命名,然后各种go,kegg等生物学功能数据库注释,最后就是单细胞高级分析3件套走起(拟时序,转录因子,细胞通讯),最后上升到肿瘤预后方面继续凑一个临床预后模型就大功告成啦。

加油,希望这些cns小辣鸡有你一份。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章