分享

DeepMind研制阿尔法狗的使命当然不是要下赢围棋

 360壬寅虎doc 2017-05-31

这几天我一直在围观人们的反应,最想不明白的一点,其实是人们究竟怎么开始把机器与人类放到对立的两面?

围棋是艺术,阿尔法狗是技术,它如何就会毁了围棋呢?棋手们自己不是也说“(现在下棋)或多或少都会受到阿老师的影响吧,下棋会让人感到更自由一些,没有什么招法是完全不能下的”(周睿羊,DeepMind博客视频),“阿尔法狗带给我们很多的新东西。现在呢,大家更多地去尝试以前都没有下过的各种下法”(时越,DeepMind博客视频)

棋手们的意思难道不是说,AI促使人类棋手更加强大,更乐于创新吗?

DeepMind创始人哈萨比斯DeepMind创始人哈萨比斯

而对于人工智能科学家而言,阿尔法狗的使命,更不是要在围棋赛中打败人类。他们之所以让机器与顶尖的人类棋手互动,意在为“狗”提供一个不能用其他方式替代的学习环境。DeepMind创始人哈萨比斯自己在很多公开场合就不止一次地说过,是为了发现潜藏的通用知识(general knowledge)。“狗”,其实是一个通用智能体。

把DM的使命说得更冠冕堂皇些,何尝不是人类对自身的进一步探索?

正如物理学家费曼教授那句留在黑板上的著名遗言,“我所不能创造的,都是我没有真正懂得的”(What I cannot create, I do not understand),如果世界在人们眼里是由外部世界和内心世界两部分组成的话,也许“内心”世界更加根本,因为外部世界的存在状态,根本还是取决于我们大脑对它的解释。这便是人工智能最引人入胜的地方:借助于建造它来更好地了解我们自己,理解这个世界。

DeepMind所致力建造的这一类AI,有个名字,叫“受神经学启发的AI”(neuralscience-inspired AI)。别忘了哈萨比斯本人就是伦敦大学学院的认知神经学博士,DM对人类身上最感兴趣的部位叫做海马体(Hippocampus)。按维基的说法:海马体是人类及脊椎动物脑中的重要部分,位于大脑皮质下方,担当着关于短期记忆、长期记忆,以及空间定位的作用。在阿兹海默病中,海马体是首先受到损伤的区域:表现症状为记忆力衰退以及方向知觉的丧失。大脑缺氧(缺氧症)以及脑炎等也可导致海马损伤。平常我们开玩笑时爱说的“老痴”或“脑残”都跟这个海马体相关。

我们需要记住,DM的AI有两个关键词,一是通用,一是学习。他们所有的算法都从元数据开始进行自主学习,从而掌握某项任务,这与预编程的人工智能有本质的不一样。此外,DM还强调,他们希望所有的系统能够通用,也就是说,希望同一个系统,或同一套算法可以有跨领域的广泛应用。公众所熟知的赢了国际象棋的IBM传奇深蓝,以及近年来的沃森系统,它们都仍然属于窄AI范畴,也就是说,它们是为了解决某个特定问题量身打造的AI,因而只能解决那一类问题。

而阿尔法狗这一类DM的AI,事实上则可以被叫做“通用人工智能”AGI(Artificial General Intelligence),目标既不针对特定任务,也无涉预编程。这就引出了眼下被热议的“强化学习”技术(reinforcement learning)。

描述强化学习其实非常简单,它有个一目了然的框架,框架内有两个内容:系统和环境。这里的“系统”就是我们说的AI,而它会发现自己处于某个“环境”当中,要达成某项目标。

“系统”与“环境”之间进行双向交流:首先,它通过其感知仪器来对“环境”进行观察,在DM的学习过程中,通常使用的是视觉,也就是说,“系统”观察到的就是像素。这些观察结果往往有很多“噪音”,并且信息不完整,因为现实世界本身就十分混乱,充满干扰,而且永远不可能对一件事获得真正完整的信息。“系统”的任务,便是要在这样的混乱条件下,创建一个可能的、最好的统计模型;这个最好的模型一旦建立,第二项任务,便是在当前的时间点上可供选择的一系列行为中,选出最好的一个,向目标靠近。而一旦“系统”确定了某一个行为是最佳之后,“系统”随即将这个行为作为输出,并得以执行。其结果,有可能会,也有可能不会,对当前的“环境”带来任何改变。但无论如何,它都成为新一轮观察的驱动。所以这个“系统”尽管表面上看,可以通过这样一个简单的框架图形来描述,但它事实上隐藏了很多的复杂性。

解决了隐藏其后的复杂性,其实就拥有了足够的智能来进行几乎一切学习。我们认同这个观点,因为我们知道,包括人在内的所有脊椎动物,都是这样来学习的。人类大脑中,完成这一“强化学习”过程的是多巴胺系统。

了解了创造出阿尔法狗的DM公司的通用智能使命,以及这一通用智能的学习原理之后,不难看出,各类游戏其实都是其算法的绝佳测试平台。一两年前连线杂志 “Wired” 就有过长文报道,DM最初使用经典的80年代雅达利游戏(Atari )来测试他们的算法。当AI在玩雅达利时,它所获得的输入没有别的,就是纯粹的像素,完全就像人在看着屏幕学,屏幕尺寸大概是200*150,所以它所得到的就是每帧3万个点,目的也很简单,一切从头琢磨自学,为了拿高分。

在基本的学习能力具备后,再通过模拟海马体的工作原理,来为智能体增加能力,例如学习抽象概念,以及增进长期记忆。

如果说AI是在利用包括棋类在内的游戏来作为测试平台,达到提升功力的目的的话,它真正的目标可能更多地在于帮助人类完成更加关键的工作,例如与预测相关的医疗、气候、能源、宏观经济等应用。这样一来,人工智能技术可以毫无疑问地被认为是眼下最重要的技术之一,更可能正是潜在的“元解决方案”(meta-solution),可以协助人类解决所有的其它问题。

提到“元解决方案”,不可避免的是与之相伴的伦理讨论。在科幻作品、断章取义的名人演说、鸡毛令箭的媒体报道的共同作用下,AI所获得的伦理关注尤其热闹。但是它与任何强大的新技术无异,技术本身是中立的,决定它是否符合伦理的,永远是掌握技术的人。在此过程中,公众、媒体、研究机构(企业)以及政府几方的透明,对每一步的监管都因此变得至关重要。

阿尔法狗的创造者的使命是要将世界的信息组织起来,让它更好地为全世界共享,换句话说,就是利用 AI或者AGI 来自动将无序的信息转化为知识,从而利用这些知识使人类更加强大。因此,与世界最优秀的人工智能专家一起,挖掘出暗藏在围棋这一古老游戏后面的智慧,促成技术的进步,这应当是乌镇比武会上所有人的胜利吧。

原标题:DeepMind的使命不是要下赢围棋

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 全屏 打印 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多