决策树与随机森林(1)—— 决策树算法数学推导与实例演练 推导决策树的原理。 决策树与随机森林(2)—— 用R种树和画树 用R语言实现决策树的构建和绘图。 决策树与随机森林(3)—— 决策树的剪枝和C4.5算法 聊了决策树的剪枝和明星算法C4.5。 决策树与随机森林(4)—— 决策树C5.0算法 讲解了C4.5的加强版C5.0. 刀磨好了,可是如何来用呢?这期就来简单解读13篇使用决策树的文章,看一下别人如何在论文中科学使用决策树算法的。 范文1范文2范文3范文4范文5范文6范文7
# 数据处理 rm(list = ls()) options(stringsAsFactors = F) library(data.table) library(tibble) library(dplyr) library(rpart) library(rpart.plot) library(C50) library(RWeka) pheno <- fread('TCGA-KIRC.GDC_phenotype.tsv',data.table = F) pheno <- pheno[,colnames(pheno)[grepl('submitter_id.samples|stage|histologic',colnames(pheno))]] colnames(pheno) <- c('ID','Grade','Stage') pheno <- pheno[pheno$Grade!=''&pheno$Grade!='GX'&pheno$Stage!='not reported',] pheno$Stage <- ifelse(pheno$Stage%in%c('stage i','stage ii'),'stage i & ii',pheno$Stage)
expr <- fread('TCGA-KIRC.htseq_fpkm.tsv',data.table = F)%>%column_to_rownames('Ensembl_ID') expr <- expr[,as.numeric(substr(colnames(expr),14,15))<10] expr <- t(expr[grepl('ENSG00000228742',rownames(expr)),])%>%as.data.frame() colnames(expr) <- 'SLINKY' expr$SLINKY <- ifelse(expr$SLINKY>median(expr$SLINKY),'High','Low')
sur <- fread('TCGA-KIRC.survival.tsv',data.table = F)[,1:2] sur$OS <- ifelse(sur$OS==0,'Alive','Dead')
data <- merge(expr,pheno,by.x=0,by.y=1) data <- merge(data,sur,by=1)[,-1] data <- as.data.frame(apply(data, 2, as.factor),stringsAsFactors = T)
#CART算法 CART <- rpart(OS~.,data,parms = list(split='gini')) printcp(CART) rpart.plot(CART,branch=1,type=2, fallen.leaves=T,cex=0.8,extra = 1,main='CART')
# C4.5算法 C4.5 <- J48(OS~.,data) plot(C4.5,main='C4.5')
范文8范文9范文10范文11范文12范文13总结
|
|