SVM是多层神经网络算法出现之前的神

taotao_2016 2020-04-17

展开全文

我们都知道其经常被用来做分类问题，当计算机的能力不足时，SVM是一个最火的算法，直到多层神经网络算法的出现。

介绍

将下面的点进行分类如何划分？划分为几类呢？

SVM是多层神经网络算法出现之前的神

220px-Svm_separating_hyperplanes_(SVG).svg.png

通过人的眼和人脑处理后，我们可以很快的分辨出是红线划分是最好的，可是计算机是如何才能知道，又如何制定规则呢？

SVM寻找区分两类的超平面（hyper plane), 使边际(margin)最大

SVM是多层神经网络算法出现之前的神

Image [4].png

如上图所示，将数据划分开的平面有很多，图一，图二都可以将数据划分开，但是每一种方式的划分的平面又有很多个平面，比如将平面进行平移也可以将数据划分开，但是是否可以一直平移？答案是否定的，它存在上下界（指的是恰好可以分开数据），也就是存在数据点正好落在分割面上，而这些点就是支持向量。

分类

按照分割的情况将SVM分为三种：

硬间隔支持向量机（线性可分支持向量机）：当训练数据线性可分时，可通过硬间隔最大化学得一个线性可分支持向量机。用通用的话来说就是上图中的虚线间没有数据点。
软间隔支持向量机：当训练数据近似线性可分时，可通过软间隔最大化学得一个线性支持向量机。用通俗的话来讲就是上图中虚线间还存在部分数据点。

SVM是多层神经网络算法出现之前的神

images [1].jpg

非线性支持向量机：当训练数据线性不可分时，可通过核方法以及软间隔最大化学得一个非线性支持向量机。无法用线性来进行划分。比如上图的情况。

算法得到公式 Image [9].png

我们再次把这个图放出来，首先我们要证明的就是线性可分支持向量机

SVM是多层神经网络算法出现之前的神

Image [4].png

首先我们假设中间的超平面方程为：

SVM是多层神经网络算法出现之前的神

Image [5].png

当然如上面所言，我们可以对这个超平面进行平移，直到达到不能移动的支持向量的点。

SVM是多层神经网络算法出现之前的神

Image [8].png

如上图公式所示，我们先证明的是二分类，让等式大于1的为正例，小于1为负例。为什么选1呢？其实你可以选任何数，同样正例与父类用（1，-1）表示也是为了计算方便。这样我们可以很容易得出：

SVM是多层神经网络算法出现之前的神

Image [9].png

这样两个公式就合并了，同时得出了条件了。

最大化边际

我们都知道svm就是要寻找使边际最大的那个状态的超平面，用M来表示两个边界平面间的距离，那么？

max M = ?

这时我们可以直接把公式简化为，

SVM是多层神经网络算法出现之前的神

Image [2].png

=1 两个平面间的距离公式直接可以得出，

M = |b+1-(b-1)|/sqrt(w^2+0)=2/||w||

所以M要最大，|w|就需要最小

所以我们得到的目标函数就是使 |w|最小，即|w|^2最小，为求导方便，我们设为求

1/2|w|^2

最小。

构造函数

通过以上两次分析，我们已经把问题转化为了大学的数学问题

在已知

SVM是多层神经网络算法出现之前的神

Image [9].png

的条件下，要使得

1/2|w|^2

最小。

这就明显变为了一个目标函数和一个约束条件，组合成的拉格朗日求最小值的问题了

但是由于条件是一个不等式，同时这个条件包含所有的数据点，利用一些数学推倒，以上公式可变为有限制的凸优化问题(convex quadratic optimization)利用 Karush-Kuhn-Tucker(KKT)条件和拉格朗日公式，可以推出MMH可以被表示为以下“决定边界“

SVM是多层神经网络算法出现之前的神

Image [13].png

详细的推倒在下面会附上。

这里举一个例子：

SVM是多层神经网络算法出现之前的神

Image [15].png

Sklearn SVM

SVM是多层神经网络算法出现之前的神

2 sklearn画出决定界限

SVM是多层神经网络算法出现之前的神

链接：https://www.jianshu.com/p/501505437200

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： taotao_2016 > 《数学》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

taotao_2016

关注对话

TA的最新馆藏

常用的多传感器数据融合方法
很多人学不好“微分几何”，不是因为数学不行，而是选错了路径
素数，是如何统一“数学王国”的？这背后有让人“下跪”的联系
人类最早的数学欲望，解方程，膨胀了几千年，形成了一个数学帝国
什么是最小二乘？
脑启发的人工智能：全面综述

喜欢该文的人也喜欢更多

热门阅读换一换