搜索

分享

QQ空间 QQ好友新浪微博微信

AdaBoost算法原理

nizhonglian 2010-11-24

展开全文

AdaBoost算法原理

(转)From：http://summerbell./blog/532376

3.1.2 AdaBoost算法原理

AdaBoost算法针对不同的训练集训练同一个基本分类器（弱分类器），然后把这些在不同训练集上得到的分类器集合起来，构成一个更强的最终的分类器（强分类器）。理论证明，只要每个弱分类器分类能力比随机猜测要好，当其个数趋向于无穷个数时，强分类器的错误率将趋向于零。AdaBoost算法中不同的训练集是通过调整每个样本对应的权重实现的。最开始的时候，每个样本对应的权重是相同的，在此样本分布下训练出一个基本分类器h₁(x)。对于h₁(x)错分的样本，则增加其对应样本的权重；而对于正确分类的样本，则降低其权重。这样可以使得错分的样本突出出来，并得到一个新的样本分布。同时，根据错分的情况赋予h₁(x)一个权重，表示该基本分类器的重要程度，错分得越少权重越大。在新的样本分布下，再次对基本分类器进行训练，得到基本分类器h₂(x)及其权重。依次类推，经过T次这样的循环，就得到了T个基本分类器，以及T个对应的权重。最后把这T个基本分类器按一定权重累加起来，就得到了最终所期望的强分类器。

AdaBoost算法的具体描述如下：

假定X表示样本空间，Y表示样本类别标识集合，假设是二值分类问题，这里限定Y={-1,+1}。令S={(X_i,y_i)|i=1,2,…,m}为样本训练集，其中X_i∈X，y_i∈Y。

① 始化m个样本的权值，假设样本分布D_t为均匀分布：D_t(i)=1/m，D_t(i)表示在第t轮迭代中赋给样本(x_i,y_i)的权值。

② 令T表示迭代的次数。

③ For t=1 to T do

根据样本分布D_t，通过对训练集S进行抽样（有回放）产生训练集S_t。

在训练集S_t上训练分类器h_t。

用分类器h_t对原训练集S中的所有样本分类。

得到本轮的分类器h_t：X →Y，并且有误差ε_t=Pr_i-Di[h_t(x_i) ≠y_i]。

令α_t=（1/2）ln[(1-ε_t)/ ε_t]。

更新每个样本的权值

，其中，Z_t是一个正规因子，用来确保Σ_iD_t+1(i)=1。

end for

④ 最终的预测输出为：

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： nizhonglian > 《数字图像处理》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

nizhonglian

关注对话

TA的最新馆藏

【转】介绍几本专业的书籍，一起学习
[转] 教你如何看手相！【手相图解】
[转] matlab函数大全
[转] 什么是女人的温柔
sci 论文常用句型摘抄
英文论文写作词汇和技巧

喜欢该文的人也喜欢更多

热门阅读换一换