模式识别系统的主要作用 判别各个模式所属的类别 对一个两类问题的判别,就是将模式x划分成ω1和ω2两类
线性判别函数 这时,若这些分属于ω1和ω2两类的模式可用一个直线方程d(x)=0来划分
用判别函数进行模式分类依赖的两个因素
多类情况1 分几类就有几个判别函数,只要有一个判别函数大于零(条件成立),则分为某一类 不确定区域由两两交集组成,把一类和其他的分开
多类情况2 仅仅判断两类(单纯的仅两类 是否能分开) 重要性质:dij = -dji 不确定区域由所有的交集组成,把类两两进行分开
多类情况3(多类情况2的特例) 所有的判别函数交于一点,对于M类就有M个判别函数 某一类判别函数越大,就越趋于分到那一类
对于M类模式的分类,多类情况1需要M个判别函数,而多类情况2需要M*(M-1)/2个判别函数, 当M较大时,后者需要更多的判别式(这是多类情况2的一个缺点)。 采用多类情况1时,每一个判别函数都要把一种类别的模式与其余M-1种类别的模式分开,而不是将一种类别的模式仅于另一种类别的模式分开。
线性判别函数简单,容易实现; 基本思想 广义线性判别函数的描述
广义线性判别函数的意义
分段线性判别函数 线性判别函数在进行分类决策时是最简单有效的,但在实际应用中,常常会出现不能用线性判别函数直接进行分类的情况。
最小距离分类 设μ1和μ2为两个模式类ω1和ω2的聚类中心,定义决策规则:
模式空间 x作为变量,w作为系统,求法向量,判断正负,看看是否属于对应分类 权空间 x作为系数,w作为变量,
Fisher线性判别 类内越紧密,类间分的越开。
l Fisher准则函数中的基本参量 1. 在d维X空间 (1)各类样本的均值向量mi
(2)样本类内离散度矩阵Si和总样本类内离散度矩阵Sw
其中Sw是对称半正定矩阵,而且当N>d时通常是非奇异的。 (3)样本类间离散度矩阵Sb
Sb是对称半正定矩阵。 2. 在一维Y空间 (1)各类样本的均值
(2)样本类内离散度和总样本类内离散度
l Fisher准则函数 Fisher准则函数定义为:
其中,是两类均值之差,是样本类内离散度。显然,应该使JF(w)的分子尽可能大而分母尽可能小,即应寻找使JF(w)尽可能大的w作为投影方向。但上式中并不显含w,因此须设法将JF(w)变成w的显函数。 由各类样本的均值可推出:
这样,Fisher准则函数JF(w)的分子可写成: 现在再来考察JF(w)的分母与w的关系:
因此,
将上述各式代入JF(w),可得: 其中Sb为样本类间离散度矩阵,Sw为总样本类内离散度矩阵。
l 最佳变换向量w*的求取
为求使取极大值时的w*,可以采用Lagrange乘数法求解。令分母等于非零常数,即: 定义Lagrange函数为: 其中λ为Lagrange乘子。将上式对w求偏导数,可得: 令偏导数为零,有; 即 其中w*就是JF(w)的极值解。因为Sw非奇异,将上式两边左乘,可得: 上式为求一般矩阵的特征值问题。利用的定义,将上式左边的写成: 其中为一标量,所以总是在向量的方向上。因此λw*可写成: 从而可得: 由于我们的目的是寻找最佳的投影方向,w*的比例因子对此并无影响,因此可忽略比例因子R/λ,有: l Lagrange乘数法(详见相关数学文献) Lagrange乘数法是一种在等式约束条件下的优化算法,其基本思想是将等式约束条件下的最优化问题转化为无约束条件下的最优化问题。 问题:设目标函数为 y=f(x),x=(x1, x2, …, xn) 求其在m(m<n)个约束条件 gk(x)=0,k=1,2,…,m 下的极值。 描述:引进函数 其中λk,k=1,2,…,m为待定常数。将L当作n+m个变量x1, x2, …, xn和λ1, λ2, …, λm的无约束的函数,对这些变量求一阶偏导数可得稳定点所要满足的方程:
·基于最佳变换向量w*的投影
–w*是使Fisher准则函数JF(w)取极大值时的解,也就是d维X空间到一维Y空间的最佳投影方向。有了w*,就可以把d维样本x投影到一维,这实际上是多维空间到一维空间的一种映射,这个一维空间的方向w*相对于Fisher准则函数JF(w)是最好的。
–利用Fisher准则,就可以将d维分类问题转化为一维分类问题,然后,只要确定一个阈值T,将投影点yn与T相比较,即可进行分类判别。
这个还是要自己去研究,这样写好像效果不好 这个坑到这里就停了 |
|