【原】R语言GEO数据处理（六）

勤劳的bee 2021-05-27

展开全文

# 5. 差异分析 -----------------------------------------------------------------

library(limma)

design=model.matrix(~group_list)

fit=lmFit(exp2,design)

fit=eBayes(fit)

deg=topTable(fit,coef=2,number = Inf)

colnames(deg)

#加probe_id列，把行名变成一列

library(dplyr)

deg <- mutate(deg,probe_id=rownames(deg$probe_id));head(deg)

#加symbol列，去重复

deg <- inner_join(deg,ids,by="probe_id");head(deg)

deg <- deg[!duplicated(deg$symbol),]

#标记上下调基因

logFC=0.1 #变化超过2倍的视为差异基因

P.Value = 0.01 #P值小于等于0.01视为显著

k1 = (deg$P.Value < P.Value)&(deg$logFC < -logFC)

k2 = (deg$P.Value < P.Value)&(deg$logFC > logFC)

change = ifelse(k1,"down",ifelse(k2,"up","not"))

deg <- mutate(deg,change);head(deg)

table(deg$change)

#加ENTREZID列，用于富集分析

library(ggplot2)

library(clusterProfiler)

library(org.Hs.eg.db)

s2e <- bitr(deg$symbol,

fromType = "SYMBOL",

toType = "ENTREZID",

OrgDb = org.Hs.eg.db)#人类

deg <- inner_join(deg,s2e,by=c("symbol"="SYMBOL"));head(deg)

write.csv(deg,file = "mydata.csv",row.names = T)

save(group_list,deg,logFC_t,P.Value_t,file = "mydata.Rdata")

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：勤劳的bee > 《R语言知识》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

勤劳的bee

教育领域优质作者

关注对话

TA的最新馆藏

kimi ai使用帮助：百度所搜的时候如何直接屏蔽掉广告
endnote 使用最烦人Bug解决办法INVALID CITATION
hot and cold tumors-冷肿瘤与热肿瘤
中文核心期刊要目总览（2020年版）核心期刊表12
中文核心期刊要目总览（2020年版）核心期刊表11
中文核心期刊要目总览（2020年版）核心期刊表10

喜欢该文的人也喜欢更多

热门阅读换一换