分享

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

 霍振丽 2018-01-07

人工智能,几经波折,起起落落。2016年3月,AlphaGo在围棋领域击败了韩国顶尖棋手李世石之后,它的热度又一次被点燃,瞬间成为了家喻户晓的科技明星。

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

那么类似这种棋谱策略游戏方面的人工智能,它是什么样的技术呢?

首先,小编为大家介绍一下人工智能这一概念。

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

人工智能(Artificial Intelligence),即AI,它是计算机科学的一个分支,它是研究、研发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

它企图了解智能的本质,并且能以人类的智能方式做出反应的智能机器,该领域的研究包括语音识别、图像识别、自然语言处理等。

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

人工智能的概念比较宽泛,它包括机器学习深度学习,并且每次技术的变革都是在解决相关智能技术遇到的瓶颈问题。

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

比如:深度学习在机器学习的基础上引入了神经网络,它可以自动学习特征和任务之间的关联,还能从简单特征中提取复杂的特征,这样就解决了传统机器学习特征提取问题难的弊端。

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

今天小编主要给大家介绍几种机器学习的算法,为以后的深度学习打基础:

算法一:逻辑回归(Logistic Regression, LR)

它为逻辑回归分析,是分类和预测算法中的一种。采用的是监督学习的方式,通过分析历史数据特征来对未来事件发生的概率进行预测。

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

代表函数是sigmoid函数,它具有我们需要的一切优美特性,其定义域在全体实数,值域在[0, 1]之间,并且在0点值为0.5。公式如下:

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

那么,如何将f(x)转变为sigmoid函数呢?

设p(x)=1即为表示具有特征x的样本被分到类别1的概率,那么p(x)/[1-p(x)]则被定义为让步比(odds ratio)。

为了解除p(x),则引入对数:

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

那么可得:

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

此时的p(x)这就是需要的sigmoid函数。如果要机器学习,那么根据已知数据,拟合出该式中n个参数c即可。

算法二:决策树

它的思想是:寻找一种算法,计算机可以根据该算法完成像if-else结构一样从根开始不断判断选择到叶子节点的树,这样的树就称为决策树。

该方法的重点就在于如何从这么多的特征中选择出有价值的,并且按照最好的顺序由根到叶。

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

信息增益则是最常见的算法之一。它划分数据集的规则是将无序的数据变得更加有序。它涉及到信息的有序无序问题,那么就要考虑信息熵(另一种方法是基尼不纯度)了。

熵在信息论中代表随机变量不确定度的度量。一个离散型随机变量 X的熵 H(X)定义为:

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

P(x),i=1,2,…,X为信源取第i个符号的概率

信息熵用来衡量信息量的大小:

若不确定性越大,则信息量越大,熵越大;

若不确定性越小,则信息量越小,熵越小。

比如我们要计算“夏天下雪”这个事件的信息熵,这个信息量很大,那么熵也很大。

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

该算法计算复杂度不高,输出结果易于理解,对中间值缺失不敏感,可以处理不相关的特征数据,它是一种非参数的监督式学习的方法,常常用于分类和回归。

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

情况三:朴素贝叶斯

在机器学习分类算法中,朴素贝叶斯和绝大多数的分类算法不同。

例如:逻辑回归(LR),svm,决策树,KNN等等,这些都是判别方法。

他们是直接学习出特征输出Y和特征X之间的关系:决策函数Y = F(X)或条件分布P(Y|X),然而朴素贝叶斯是生成方法,它直接找出特征输出Y和特征X的联合分布P(X,Y),则可知:P(Y|X) = P(X,Y)/P(X)

首先回顾一下朴素贝叶斯相关的统计学知识:

贝叶斯的思想可以等效为:先验概率 数据=后验概率

一般来说先验概率就是我们对于数据所在领域的历史经验,但是这个经验常常难以量化或者模型化,那么我们可以假设先验分布的模型,比如正态分布,高斯分布等。

假如X和Y相互独立,则有:

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

假如X和Y不相互独立,则公式:

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

Or:

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

那么,则有全概率公式:

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

从上面的公式很容易得出贝叶斯公式:

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

该算法在scikit-learn中,一共有3个朴素贝叶斯的分类算法类。

它们分别是GaussianNB,BernoulliNB和MultinomialNB。

其中:

1)GaussianNB表示先验为高斯分布的朴素贝叶斯;

2)BernoulliNB表示先验为伯努利分布的朴素贝叶斯;

3)MultinomialNB表示先验为多项式分布的朴素贝叶斯。

这三个类适用的分类场景各不相同,一般来说:

1)假如样本特征的分布绝大部分是连续值,使用GaussianNB;

2)假如样本特征是二元离散值或者很稀疏的多元离散值,则BernoulliNB;

3)假如样本特征的大部分是多元离散值,使用MultinomialNB。

总之在很多实际应用中,贝叶斯理论很好用,比如垃圾邮件分类,文本分类。

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

总之机器学习算法是构架深度学习神经网络的基础,只有我们打好了基础,我们才能更好的学习,深度学习的精髓。

李世石的对手远比他想象的更强大!AI学习的深奥逻辑令人悚然

最后小编推荐,DeepMind团队和暴雪公司给大家提供了基于星际争霸II的强化学习环境SC2LE,它提供一个开源的Python界面,用于与游戏引擎进行通信,据相关的强化学习算法构造一个基于游戏行为的控制策略。希望大家体验下。

本文属于由科技原创,转载请联系后台

文|由小来

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多