分享

跟着Cell学单细胞转录组分析(十一):单细胞基因评分|AUCell评分

 TS的美梦 2022-03-17

第一次接触基因评分是在一篇文章中,也不知道这样的叫法对不对,作者选定了几个炎症基因,利用seurat包的一个打分函数AddModuleScore,依据基因的平均表达水平进行分析,最后得到的score称为炎症分数,其实这样的叫法有点欠缺,但是有这样的做法。(演示数据没有意义)

选择基因进行计算。

DefaultAssay(immune) <- "RNA"cd_features <- list(c(  'TNF',  'CCL2',  'CCL3',  'CCL4',  'CXCL10',  'S100A8',  'CXCL1'))
Inscore <- AddModuleScore(immune, features = cd_features, ctrl = 100, name = "CD_Features")colnames(Inscore@meta.data)colnames(Inscore@meta.data)[27] <- 'Inflammatory_Score' 

其实构建了一个Inscore的seurat对象,对其进行可视化。

VlnPlot(Inscore,features = 'Inflammatory_Score',         pt.size = 0, adjust = 2,group.by = "orig.ident")


将其映射到UMAP,更加直观。

library(ggplot2)mydata<- FetchData(Inscore,vars = c("UMAP_1","UMAP_2","Inflammatory_Score"))a <- ggplot(mydata,aes(x = UMAP_1,y =UMAP_2,colour = Inflammatory_Score))+  geom_point(size = 1)+scale_color_gradientn(values = seq(0,1,0.2),                                             colours = c('#333366',"#6666FF",'#CC3333','#FFCC33'))a+ theme_bw() + theme(panel.grid.major = element_blank(),                      panel.grid.minor = element_blank(), axis.line = element_line(colour = "black"),                      panel.border = element_rect(fill=NA,color="black", size=1, linetype="solid"))

箱线图展示不同组织之间的评分差异。

data<- FetchData(Inscore,vars = c("group","Inflammatory_Score"))ggplot(data, aes(x=group,y=`Inflammatory_Score`)) +  theme_bw()+RotatedAxis()+  theme(panel.grid = element_blank(),        axis.text.x=element_text(angle=10,hjust = 1,vjust=0.5))+  labs(x=NULL,y=NULL,title = "Regulation of necroptotic process")+ geom_jitter(col="#00000033", pch=19,cex=2.5, position = position_jitter(0.2))+  geom_boxplot(position=position_dodge(0),aes(color = factor(group)))+  NoLegend()+theme(plot.title = element_text(hjust = 0.5))  #也就加上这一行,标题居中

=======================================

AddModuleScore函数仅仅是对选定的基因进行评分,其意义有限。而另一种对基因集的打分方式---AUCell,可以鉴定某个通路活跃的基因集在细胞群上的展示,也可以理解为对通路活性的评分。初次看到这个还是在一篇NM的文章里,用了大量的AUCell分析,可以学习一下。

首先安装AUCell这个包,并加载相关R包。

if (!requireNamespace("BiocManager", quietly = TRUE))  install.packages("BiocManager")BiocManager::install("AUCell",force = TRUE)library(AUCell)library(clusterProfiler)

对细胞表达矩阵排列,下载GSEA基因集文件,网址:http://www./gsea/downloads.jsp,选择自己需要关注的板块。进行评分计算。

cells_rankings <- AUCell_buildRankings(immune@assays$RNA@data) Hallmarker <- read.gmt("h.all.v7.5.1.symbols.gmt"geneSets <- lapply(unique(Hallmarker$term), function(x){print(x);Hallmarker$gene[Hallmarker$term == x]})names(geneSets) <- unique(Hallmarker$term)cells_AUC <- AUCell_calcAUC(geneSets, cells_rankings, aucMaxRank=nrow(cells_rankings)*0.1)

选定某一个需要关注的通路,进行可视化。

##set gene set of interest here for plottinggeneSet <- "HALLMARK_TNFA_SIGNALING_VIA_NFKB"aucs <- as.numeric(getAUC(cells_AUC)[geneSet, ])immune$AUC  <- aucs
library(ggraph)ggplot(data.frame(immune@meta.data, immune@reductions$umap@cell.embeddings), aes(UMAP_1, UMAP_2, color=AUC)) + geom_point( size=1.5) + scale_color_viridis(option="A") + theme_light(base_size = 15)+labs(title = "TNFA_SIGNALING_VIA_NFKB")+ theme(panel.border = element_rect(fill=NA,color="black", size=1, linetype="solid"))+  theme(plot.title = element_text(hjust = 0.5))

以上就是今天的分享了,关键是要找到合适的基因应用到具体的研究,找好需要的基因集。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多