分享

BP神经网络和支持向量机在R语言中的实现

 不丁真人 2017-07-20

BP(Back Propagation)神经网络 是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)。

下面用R语言中的nnet程序包进行分类算例和回归算例,第一个例子是对河流的化学属性对其中的藻类进行回归预测,第二个例子是著名的鸢尾花算例。

#首先读入程序包并对数据进行清理
library(DMwR)
library(nnet)
data(algae)
algae <- algae[-manynas(algae),="" ]="">
clean.algae <- knnimputation(algae[,1:12],k="10)">

#神经网络还需要对数据进行标准化
norm.data <- scale(clean.algae[,4:12])="">
#使用nnet命令,参数规定隐层单元个数为10,权重调整速度为0.1,最大迭代次数为1000次,线性输入。
nn <- nnet(a1~.,="" norm.data,="" size="10," decay="0.01,">
 maxit = 1000, linout = T, trace = F)
#利用模型进行预测
norm.preds <- predict(nn,="" norm.data)="">
#绘制预测值与真实值之间的散点图
plot(norm.preds~ scale(clean.algae$a1))

#计算相对误差
(nmse2 <- mean((norm.preds-scale(clean.algae$a1))^2)/="">
mean((mean( scale(clean.algae$a1))- scale(clean.algae$a1))^2))

再来看看处理分类数据的表现,利用iris数据来判断花的种类

model.nnet <-nnet(species ~="" .,="" linout="F,size" =="" 10,="" decay="0.01,">
 maxit = 1000,trace = F,data = iris)
#对分类数据预测需要加上type参数
pre.forest=predict(model.nnet, iris,type=’class’)
table(pre.forest,iris$Species)

pre.forest setosa versicolor virginica setosa 50 0 0 versicolor 0 49 0 virginica 0 1 50

其预测只有一个错误,效果不错

支持向量机SVM是九十年代中期发展起来的新的机器学习技术,与传统的神经网络NN技术不同,SVM是以统计学习理论SLT为基础,NN是以传统统计学理论为基础。传统统计学的前提条件是要有足够多的样本,而统计学习理论是着重研究小样本条件下的统计规律和学习方法的,它为机器学习问题建立了一个很好的理论框架。

实践表明,建立在SLT之上支持向量机不仅结构简单,而且技术性能尤其是推广能力明显提高,能够解决好大量现实中的小样本学习问题,它是一个全新的神经网络技术。

library(e1071)

model.svm <- svm(a1~.,="" norm.data)="">
preds <- predict(model.svm,="" norm.data)="">
plot(preds~ scale(clean.algae$a1))

model.svm <-svm(species ~="" .,data="iris)">
pre=predict(model.svm, iris,type=’class’)
table(pre,iris$Species)

多元自适应回归样条(MARS)

library(earth)
model.mars <- earth(a1~.,="" clean.algae)="">
preds <- predict(model.mars,="" clean.algae)="">
plot(preds~ clean.algae$a1)
(nmse2 <- mean((preds-clean.algae$a1)^2)/="">
mean((mean( clean.algae$a1)- clean.algae$a1)^2))

model.mars <-earth(species ~="" .,data="iris)">
pre=predict(model.mars, iris,type=’class’)
table(pre,iris$Species)

本文转载自:数据科学与R语言

欢迎加入我爱机器学习QQ12群:648711796

微信扫一扫,关注我爱机器学习公众号

微博:我爱机器学习

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多