Alpha Go的胜利，带给我们什么启示？

昵称5609635 2018-03-25

展开全文

站在今天，我们可能更需要谈Alphago Zero的胜利带给我们的启示。 2017年10月，这个仅仅通过3天的自我学习，通过单一神经网络，更少的机器硬件（4TPU vs 48TPU）而击败了Alpha Go老版的家伙，代表着我们迈入了超级智能的时代。

为什么打败柯洁会是这样一个标志性事件，或者说为什么是围棋？当然Alpha Go从来都不仅仅关乎围棋游戏本身，然而掌握围棋有着重大的意义，因为围棋非常复杂，围棋中各种变数的数量甚至超过了宇宙原子的数量。

Alpha Go开发的目的仅仅是为了击败人类棋手吗？当然不是，是希望通过围棋来训练它的算法，从而能够应用到解决我们日常生活许多相似的问题中来。例如，DeepMind已经利用了AlphaGo背后的技术，帮助谷歌大幅削减其数据中心的能耗。“阿尔法狗”之父哈萨比斯还希望能够通过人工智能在蛋白质折叠或设计新材料等问题上取得进展，推动人们理解生命和影响人类社会。

启示一：Alpha Go 的胜利并不意味着技术奇点已经到来，虽然它在不断逼近。它是否能够代表智能计算发展方向也还有争议，但Alpha Go的胜利象征着计算机技术已经进入人工智能新IT时代，其特征是大数据、大计算、大决策三位一体。 Alpha Go的胜利代表了在某些垂直领域计算机已经超越了人类的智能，但是达到科幻小说或电影中的通用人工智能还有很长的路要走

启示二：Alphago Zero的胜利代表着出我们在向建造真正智能化的机器方面迈出了一大步，因为即使在没有大量训练数据的情况下，机器也需要找出解决困难问题的方法。

启示三：“监督学习是昨天，强化学习是今天，迁移学习是明天”--借用下港大杨强教授的预判，因为在小数据和个性化的趋势下，迁移学习正在展现出极大的商业应用价值。如下图所示

吴恩达认为下一步将是迁移学习的商业应用大爆发。目前这一波的人工智能技在日常生活中的商业应用，主要是由监督学习来引领和推动，而这优势建立在深度学习的进步、计算力的提升和有标记的大型数据集基础之上，但监督学习的算法在新情况上的泛化能力和训练模型所有要的海量数据往往难以获取。迁移学习可以解决小数据和个性化的问题。而在小数据上学习的模型，能够举一反三触类旁通的智能才是真正的智能。

启示四：大数据的金矿？监督学习是大数据的胜利，而在强化学习领域，是算法和逻辑的胜利。大数据与算法和逻辑的对决，后者技高一筹。在人工智能进阶的途中，手握数据的金矿可能会变得不名一文吗？

启示五：Zero胜利后面的哲学深意：我们得益于经验，同时又被这些经验所桎梏。在监督学习下，依靠人类专家的指导，反而可能会导致人类对计算机能力的限制，而强化学习不再受到人类知识的限制，依靠毫无人类偏见和预设的模型反而更加强大。在机器对人类智慧的挑战中，启发我们重新审视我们的默认智慧，或者提供了重新审视默认智慧的其他路径，而这些路径之前尚未被人类所知。机器可以发明新的更加高效的解决问题的方法。比如在输给了AlphaGo之后，柯洁通过向机器学习寻找灵感。之后他取得了已22连胜的成绩打败了人类对手的惊人战绩。智能的提升是双向的。