机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。根据从例子中学习的方法分类,机器学习算法可分为:监督式学习、非监督式学习、半监督学习、强化学习 1、监督式学习:对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测。这里,所有的标记(分类)是已知的。因此,训练样本的岐义性低。 (线性回归、逻辑回归、决策树、随机森林、K – 近邻算法、神经网络。。。)
2、非监督式学习:对没有概念标记(分类)的训练样本进行学习,以发现训练样本集中的结构性知识。这里,所有的标记(分类)是未知的。因此,训练样本的岐义性高。 (关联算法、K – 均值算法/聚类。。。) 3、半监督式学习:训练数据的一部分是有标签的,另一部分没有标签,而没标签数据的数量常常极大于有标签数据数量(这也是符合现实情况的)。隐藏在半监督学习下的基本规律在于:数据的分布必然不是完全随机的,通过一些有标签数据的局部特征,以及更多没标签数据的整体分布,就可以得到可以接受甚至是非常好的分类结果 4、强化学习:机器被放在一个能让它通过反复试错来训练自己的环境中。机器从过去的经验中进行学习,并且尝试利用了解最透彻的知识作出精确的商业判断。 (马尔可夫决策过程。。。) |
|
来自: 昵称47792475 > 《机器学习》