【一文看懂】机器学习是如何工作的？

timtxu 2017-04-22

展开全文

大数据公社成员1分钟前

机器学习

机器学习是人工智能的分支，它不仅在改变着我们如何与机器交互,也改变着我们与周围世界的联系。过去数十载,机器学习帮助我们实现了自动驾驶汽车，语音识别，高效的网络搜索，个性化的推荐服务，以及极大提升了对人类基因的认识。“机器学习”一词可以追溯到1959年，当时，IBM研究员Arthur Samuel将它定义为”(计算机)无需明确编程即可学习能力”。机器学习领域涵盖了大量的数学方法，计算机可以通过这些方法并根据样本”训练”数据去学习并优化他们自己的解决方案。然而，机器学习事实上是如何工作的呢？

过去的计算机

计算机最初被设计去遵循算法操作。一个算法仅仅是被编码成计算机语言的一系列步骤。娴熟的计算机程序员通过与流程专家沟通，将业务操作转化成一个流程图，进而将它实现成计算机程序。一个流程图可以清晰地把要执行的任务以及要做的任何决策都按照执行顺利布置出来。流程图对可重复,可预测(决策基于非歧义的数据)过程的建模方面是卓越的。这些系统通常被称为是确定的。

未来的计算机

并非所有的过程都遵循清晰的，不变的规则，而且现实中的大部分决策都不是指向单个明确的答案。机器学习系统是概率性的：任务的执行，决策的做出都是基于不完整的信息，最终结果也是基于正确的概率。机器学习适合去处理诸如分类(将对象划分为两类或者多类)，回归(发现变量之间的联系)，聚类(依据相似特性对对象进行分组) 的问题。因此他们可以有下列应用

模式识别：

l 语音识别

本质提取：

l 自由格式的文本，语音或者视频

l 鉴别垃圾邮件

在如下情景中发现异常：

l 金融交易异常

l 传感器读取异常

在如下情景中做预测：

l 未来股价或者货币汇率

l 哪个电影这个人会喜欢？

许多数学方法支撑机器学习，其中关键的一些比如：

线性和多项式回归

回归关注对于数值变量之间关系的建模。这种关系会通过利用模型的预测误差的度量进行迭代优。基础假设是输出变量(单一数值)可以表达为一系列输入数值变量的组合(加权和)。

决策树

这些树状流程图利用分支去展示一个决策的所有可能输出。基于数据中的实际值或属性，大部分决策树利用二分法(两个选项)。对于大量数据，我们可以建立多个决策树的随机森林，它们一起在输出中形成一个共识的决策。决策树可以用来处理分类和回归的问题.

神经网络

这个概念受到生物神经系统,如大脑,处理信息的启发。大量互相联结的处理单元共同工作来解决特定的问题，通常是一些分类或者模式匹配的问题。每个神经元对决策结果进行”投票”，这样可能进而激发另一个神经元进行投票，这些投票统计后，依据输出结果的支持产生一个相应结果的排名。

贝叶斯网络

这些图形化结构，通常又称为信念网络，可以表征不确定领域的知识。图是一个因果关系的概率映射，其中每个节点表示一个随机变量，而节点间的边表示概率上的依赖关系。例如，“晚霞”可能导致75%的几率是一个”好天气”。这些条件依赖关系通常通过统计和计算方法估计。

聚类的目标是将数据集划分到两个或者多个分组中，进而将数据组织到更有意义的集合。例如，通过相似的购买行为对用户进行分组。这是通过识别包含一种类型的数据点的最小球面而完成的。

马尔科夫链

马尔科夫链是描述从一个”状态”(一种情形或者数值集合)到另外一种状态的数学系统。它假设未来的状态仅仅依赖于现在的状态，而与此之前的其他事件序列无关。例如，如果你用一个马尔科夫链来模拟婴儿的行为，你可能会包含”玩”、“吃”、“睡”和”哭”这些状态，这些状态与其他行为共同组成了一个状态空间，即一个所有可能状态的列表。除此之外，马尔科夫链还能告诉你从一个状态跳跃或者转移到另外一个状态的概率，例如，婴儿从当前的玩的状态到下五分钟睡着而不先哭的几率。