此文献给所有对人工智能(AI)感兴趣但是仍然未对其有深入了解的传统的数据科学家们。这篇文章对与今天大众媒体口中的人工智能相结合的数据科学技术进行了概述。 我们曾经写过一些关于组成人工智能(AI)的多种数据科学技术。我依然听到很多人把AI当做单一的个体来请教关于它的问题。其实AI并不是一个个体,而是众多数据科学技术的集合。而在现阶段的发展中这些技术还未被很好地整合起来,更不能说被易于使用。尽管如此在每一个数据科学领域,我们已经在大众媒体的关注下获得了很大进步。 这篇文章并非是一个对数据科学的深入研究,而更像是一个对数据科学现在的情况作一个通俗的走马观花式的概述。如果你是一个的传统意义上的数据科学家,或者你已经读过一些文章但是暂时未能将数据科学的重点信息了解清楚,那么这可能是一篇能帮助你将现有知识整合起来甚至能帮助你发掘自己兴趣点的文章。 AI只是其数据科学组成部分的一个集合 组成AI的数据科学组成部分分为以下几类。其中可能会有些重叠,但是这些将会是你在媒体上看到的详细类别。
以上便是所有不同的类别(深度学习其实包括了一些其它分类)。它们之间的联系并不紧密,多数是被初创公司和技术界的重要公司同时应用在一些新奇的项目上。它们在被成功地应用时能够产生1+1>2的效果,例如在Watson和Echo/Alexa网站上的应用,或者是开始被用在无人驾驶汽车技术中。尽管如此,这些技术的整合仍会是一个很大的挑战。 AI需要完成什么任务?
你能够马上开始看到今天很多在商业上对AI的应用只要求其中的几种能力。但是我们期望中更复杂的应用将会需要所有这些功能。 将人类的能力转化为数据科学 在这里我们讲述的内容会开始变得凌乱和难以理解。 上面说的的每一个功能都不必要与它们对应的数据科学技术一一对应。 但是如果想要真正理解AI在今天的发展,理解数据科学技术如何与这些功能要求相匹配是很重要的。它们之间的匹配关系如下图所示。 深度学习的情况 你可能注意到“深度学习”并没有在图中出现。那是因为它是上图中递归神经网络和卷积神经网络两者的集合。人工神经网络(ANNs)作为最高级的集合登记,在80年代开始被使用,并且一直是标准数据科学机器学习工具包中的一部分,被用于解决标准分类和回归问题。 最近我们更大量地运用平行处理、云处理和GPU(图形处理器)来取代传统英特尔芯片,使我们能够对不同版本的有着几甚至过百个隐藏层的ANN进行实验。这些隐藏层就是我们所说的“深度”,从而形成“深度学习”。添加隐藏层意味着增加运算复杂性,这也是我们为什么不得不等硬件发展速度赶上我们野心的膨胀速度。现在至少有27种不同类型的ANN,但最重要的是卷积神经网络(CNN)和递归神经网络(RNN),如果没有它们,图像和自然语言处理将是不可能的。 对数据科学的简单讨论 要对任何这些基础数据科学技术进行定义需要很多篇幅。 我们将在这里提供最简短的描述和一些包含更完整的信息的链接。
对抗性CNN通过将图像像素值转换为复数数值向量来执行图像识别的任务。 如果你将它们 逆向运行,即从任意数值向量开始运行,它们就会创建出图像,用这个方法创造伪造的画 作,试图欺骗那一个学习如何检测伪造品的CNN。 他们互相对抗,直到生成式CNN(伪 造者)伪造的图像真实到连那一个CNN都不能将它们与真实画作进行分辨。这时伪造者 CNN和分辨者CNN打成平手。 被用作分辨将伪造画作与真实画作的CNN在检测伪造品方面已经被进行了卓越的训练。在 此之后我们不必再对成千上万的法国印象派画作大师提出分辨伪造画作这种不切实际的要 求了。总的来说,这就是人工智能网络从他们的环境中学习的例子。
QAM需要大量关于要研究主题的数据,这些数据由人工加载,并且随后必须用人工训练和 维护知识库。 然而,一旦建立,他们已被证明在多个领域具备专业能力,包括癌症检测 (与CNNs结合)、医学诊断、发现材料和化学品的独特组合、甚至指导的高中学生如何编 程。 简而言之,对于任何一个 巨型的需要专业编译的知识体,QAM都可以像大脑一样对其 进行编译(或至少形成AI的关联记忆)。
第三代人工智能将基于Spiking神经网络(也称为神经形态计算)进行发展,因为它试图更密切地模仿大脑实际工作的方式。 第三代变化的核心围绕着脑神经元不经常彼此通信,而是在信号的尖峰这个事实。 我们的挑战是找出一个合适的方法将消息编码进这个电脉冲串中。 目前我们还在中期研究阶段,我只知道它的两个被应用于商业应用程序的实例。 很多投资和脑力正在涌入这一发展。 它还将需要一种全新类型的芯片,这将意味着另一个硬件革命。 当Spiking神经网络到达时,我们期待: 它们可以从一个来源学习,并应用到另一个来源。 它们可以概括他们的环境。 它们可以记住已经做过的事情。 一旦学习的任务可以被调用并应用于其他数据。 它们更节能,打开了一条小型化的道路。 它们从自己的环境中学习,没有监督,只有很少的例子或观察对象。 这使它们快速学习。 跟上AI的发展 为了跟上AI的发展,我们需要跟随以上介绍的技术和两个趋势。 一是AI的商业化,因为它目前(第二代)以一种飞快的速度被运用到几乎一切东西上。AI在未来很可能与电气化在20世纪20年代的美国一样普遍。 二是Spiking神经网络的进步,它们将使这一切都更令人惊叹。 |
|
来自: 昵称11935121 > 《未命名》