【原】上海交通大学金贤敏团队研发量子围棋，人工智能或遇终极考验

学术头条 2020-11-27

展开全文

近日，来自上海交通大学的金贤敏教授研究团队开发了一种更加复杂的围棋版本，研究人员利用光子纠缠模拟处于量子叠加状态的棋子，开发出了量子力学版本的围棋。通过量子力学中的固有随机性，以增加围棋游戏不确定性。

研究论文近日发表在 arXiv 预印本平台。

人机对战之围棋场

1997 年， IBM 的 “Deep Blue（深蓝）” 计算机击败国际象棋大师加里・卡斯帕罗夫（Garry Kasparov），当时引发了人们对于 “未来人工智能或许可能超越人类大脑” 的无穷遐想，也为人机对战的发展树立了一座里程碑。

相比象棋，围棋这一古老的博弈游戏拥有着更加复杂多变的棋局，计算难度之大可比天文数字，堪称世界上最复杂的棋类游戏。想要机器在棋盘上战胜人类，也成为多年来人工智能领域的一大挑战。

2016 年，人工智能公司 DeepMind 的深度学习算法 AlphaGo 击败世界顶尖围棋选手李世石，当时一些媒体甚至用 “人类最后的智力骄傲即将崩塌” 来渲染此事。

2017 年，DeepMind 公司发布的新人工智能算法 AlphaZero，仅利用强化学习算法，通过 3 天的自我学习训练，击败了曾经击败人类的AlphaGo，成为了世界顶尖的围棋手。

考虑到围棋中可能出现的棋盘位置数量远高于此，想要让机器击败围棋大师，或在扑克牌和麻将游戏中击败人类，已经成为人工智能程序的开发者们一直在寻求更大的挑战。

中国上海交通大学的金贤敏教授表示， “长期以来，棋盘游戏一直是人工智能的良好测试床，因为这些游戏提供了具有特定和简单规则的封闭世界”。

2016 年，物理学家 Andre Ranchin 提出了一种 “量子围棋”，和当时开发的量子力学国际象棋一样，都是出于对量子力学的科普和教学目的。如今，金贤敏教授的研究团队设计出来的量子围棋，其目的更多是出于挑战人工智能对弈程序的算力极限。

神奇的量子围棋

围棋起源于中国，在古代称之为 “弈”，是一种类似于跳棋但又高于跳棋的棋盘游戏，棋手使用格状棋盘和黑白石子进行对弈。棋盘上纵横各 19 条线段将棋盘分成 361 个交叉点，棋子走在交叉点上，双方交替行棋，落子后不能移动，以围地多者为胜。

围棋一直以来也被认为是世界上最复杂的棋盘游戏之一，但对于机器学习算法来说，围棋实际上并非最难处理的游戏，它不仅取决于游戏的复杂性，而且与游戏的特性和策略高度相关。

量子围棋可以在普通的棋盘上玩，但也需要一台计算机来记录棋局的状态，并需要设备来生成一对量子纠缠的光子。

在经典的围棋游戏中，每位棋手每走一步放一颗棋子，而量子围棋则是让对弈双方放下成对的 “纠缠” 棋子，两颗棋子都留在棋盘上，直到它们接触到相邻顶点的一颗棋子，这时通过一次 “测量” 将纠缠光子对叠加起来，最终也就只落下一颗棋子。

这种纠缠光子带来的随机性使得围棋游戏变得更加复杂，对弈双方的决策难度要求更高。棋手可以调整自己的量子棋子出现在一个位置的概率，也使得其中一个棋手可以比对手拥有更多关于棋子可能最终出现在哪里的信息。

这种更加复杂的量子围棋，无疑也给人工智能围棋手带来了新的挑战。

量子围棋机的草图

a）量子石盒子的实验装置。可以将生成的光子对调整为最大纠缠态、非最大纠缠态和乘积态，以充当不同的量子石。

b）塌方测量模块。当光子进入该模块时，将通过偏振分束器（PBS）对其进行测量，然后量子态崩溃至路径 1 和 3（或路径 2 和 4），四个单光子探测器将光子信号转换为电子信号。

c）时间记录模块。塌方测量模块的四个输出通道将被引导到该模块中，可以通过适当的重合时间窗口来获取每对纠缠光子的崩溃结果信息，并将其作为有效存储状态记录在时间序列数据中。这里将通道 1 和 3 中的信号重合编码为 1，将通道 2 和 4 中的信号重合编码为 0。

d）从时间序列数据中使用量子石玩量子围棋的草图。两个机械臂代表两个一起执行量子围棋游戏的棋手代理，他们从量子石盒子中交替选择量子石，并将每块石头放在虚拟板的两个交叉点上。当量子石被放在有邻居的相交处时，游戏会从时间序列数据中获得崩溃结果，并在崩溃测量模块中使用回溯的测量结果。

伦敦玛丽皇后大学（Queen Mary University of London）的 Mike Cook 表示：“量子围棋增加了围棋规则的复杂性，因为它扩展了玩家在对战回合中棋盘可能的变化方式，增加了棋手在对弈过程中的精神负担，也增加了预测棋局下一步的计算能力。”

随机性和不完全性

在前文提到的量子围棋机中，研究人员通过不断产生纠缠光子并存储测量结果，在一小时内产生了大约 1 亿个坍塌概率，这些数据足以支持在一个 10,000 * 10,000 的棋盘上进行一亿步棋的游戏。通过分析时间序列的 1 和 0 状态分布，研究人员发现这些数据是随机的。

金贤敏教授表示，由于量子力学的固有性质，他们所设计的这种量子围棋产生的随机性与一些经典物理过程所存在的随机性相比，要更清晰得多。

由于在量子围棋中，当任何一颗棋子处于纠缠状态时，棋手在测量前都无法判断纠缠光子对中的哪颗会最终落在棋盘上，因此也就不清楚能否成功包围对手。

研究人员表示，测量过程可以通过工程量子纠缠进行调整，如果每对纠缠光子代表的棋子最大程度地纠缠在一起，测量结果完全会是随机的。由于在传统的围棋游戏中，落子概率只有下棋的人知道，但引入光子纠缠的量子围棋的出现，使得围棋游戏失去了一些随机性，但同时却增加了信息不完整的元素。

AI的终极挑战？

金贤敏说：“随着人工智能在各个领域超越人类，量子系统可能是人类意识和直觉击败人工智能巨大计算能力的唯一空间。” 目前，金教授的研究团队还尚未训练人工智能下量子围棋，所以无法断定在这样的棋局中，人工智能是否能击败人类选手。

Cook 表示，更难的棋局可能不是未来的方向。他说：“人工智能研究不仅仅是要找到最复杂、最纠结的问题，还需要找到那些看似简单的问题，并弄清楚为什么人工智能在这些问题上表现得如此糟糕。量子围棋听起来是一个非常有趣的游戏，但我不认为通过击败量子围棋，我们会学到很多关于人工智能的知识。”

研究人员指出，量子围棋的复杂性和难度之间的确切关系“仍然是一个悬而未决的问题”，但它的魅力在于能够覆盖更多的难关。

他们宣称，通过增加虚拟围棋棋盘的大小以及调整围棋的纠缠度，即使那些隐藏了最多信息的游戏，比如麻将，也有可能达到同样的难度。因此，量子围棋可以为 “测试人工智能的新算法提供一个通用且有前景的平台”。

排版：赵辰霞
编审：王新凯

参考资料：
https:///a/quantum-go-machine-plays-ancient-board-game-using-entangled-photons/
https://www./article/2250551-quantum-version-of-the-ancient-game-of-go-could-be-ultimate-ai-test/
https:///news/2020-08-entangled-photons-quantum.html
https:///abs/2007.12186