R语言中Logistic回归

脑系科数据科学 2020-05-18

展开全文

# 设置工作空间

# 把“数据及程序”文件夹拷贝到F盘下，再用setwd设置工作空间

setwd("E:\\R_workspace\\R语言数据分析与挖掘实战\\chp5")

# 读入数据

Data <- read.csv("./data/bankloan.csv")[2:701, ]

View(Data)

# 查看数据框中完整的记录数

sum(complete.cases(Data))

# 查看数据框中不完整的记录数

sum(!complete.cases(Data))

# sum(is.na(Data))

# 查看数据框中缺失比例

mean(!complete.cases(Data))

# 查看数据框中不完整的记录详情

Data[!complete.cases(Data),]

# 数据命名

colnames(Data) <- c("x1", "x2", "x3", "x4", "x5", "x6", "x7", "x8", "y")

View(Data)

# logistic回归模型

# R语言广义线性模型glm()函数

# glm(formula, family=family.generator, data,control = list(…))

# formula数据关系，如y~x1+x2+x3

# family：每一种响应分布（指数分布族）允许各种关联函数将均值和线性预测器关联起来。

# 常用的family：

# binomal(link=’logit’) —-响应变量服从二项分布，连接函数为logit，即logistic回归

# binomal(link=’probit’) —-响应变量服从二项分布，连接函数为probit

# poisson(link=’identity’) —-响应变量服从泊松分布，即泊松回归

# control:控制算法误差和最大迭代次数

glm <- glm(y ~ x1 + x2 + x3 + x4 + x5 + x6 + x7 + x8,

family = binomial(link = logit), data = Data)

summary(glm)

# 逐步寻优法 forward前向选择法backward后向选择法

logit.step <- step(glm, direction = "both")

summary(logit.step)

# 前向选择法

logit.step <- step(glm, direction = "forward")

summary(logit.step)

# 后向选择法

logit.step <- step(glm, direction = "backward")

summary(logit.step)

————————————————

原文链接：https://blog.csdn.net/mr_muli/article/details/80526191

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：脑系科数据科学 > 《数据科学》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

脑系科数据科学

科学领域优质作者

关注对话

TA的最新馆藏

power analysis
如何在虚拟环境中彻底删除spyder
如何安装github上的停止更新的python库
广义估计方程GEE的链接矩阵
机器学习模型评价中的宏平均和微平均，用Python和R实现
生存分析究竟可以干什么

喜欢该文的人也喜欢更多

热门阅读换一换