机器学习概述

昵称47792475 2017-09-25

展开全文

机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。根据从例子中学习的方法分类，机器学习算法可分为：监督式学习、非监督式学习、半监督学习、强化学习

1、监督式学习：对具有概念标记（分类）的训练样本进行学习，以尽可能对训练样本集外的数据进行标记（分类）预测。这里，所有的标记（分类）是已知的。因此，训练样本的岐义性低。

（线性回归、逻辑回归、决策树、随机森林、K – 近邻算法、神经网络。。。）

监督式学习分为两大类：回归分析、分类

回归分析：其数据集是给定一个函数和它的一些坐标点，然后通过回归分析的算法，来估计原函数的模型，求出一个最符合这些已知数据集的函数解析式。然后它就可以用来预估其它未知输出的数据了，你输入一个自变量它就会根据这个模型解析式输出一个因变量，这些自变量就是特征向量，因变量就是标签。而且标签的值是建立在连续范围的。

分类：其数据集，由特征向量和它们的标签组成，当你学习了这些数据之后，给你一个只知道特征向量不知道标签的数据，让你求它的标签是哪一个。其和回归的主要区别就是输出结果是离散的还是连续的。

2、非监督式学习：对没有概念标记（分类）的训练样本进行学习，以发现训练样本集中的结构性知识。这里，所有的标记（分类）是未知的。因此，训练样本的岐义性高。

（关联算法、K – 均值算法/聚类。。。）

3、半监督式学习：训练数据的一部分是有标签的，另一部分没有标签，而没标签数据的数量常常极大于有标签数据数量（这也是符合现实情况的）。隐藏在半监督学习下的基本规律在于：数据的分布必然不是完全随机的，通过一些有标签数据的局部特征，以及更多没标签数据的整体分布，就可以得到可以接受甚至是非常好的分类结果

4、强化学习：机器被放在一个能让它通过反复试错来训练自己的环境中。机器从过去的经验中进行学习，并且尝试利用了解最透彻的知识作出精确的商业判断。

（马尔可夫决策过程。。。）

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：昵称47792475 > 《机器学习》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

昵称47792475

关注对话

喜欢该文的人也喜欢更多

热门阅读换一换