棋闻详情"如果人工智能碰上座子围棋规则？者：章浒

二马仔 2020-05-28

展开全文

编者按：提到座子，可能大多数棋友会联想到黑白对角星对于布局的限制乃至导致中国围棋的全面落后于日本。但我们不得不承认，在座子围棋的规则中有许多值得现代围棋借鉴、学习、思考的理论。在弈客app中天弈规则引入了“还棋头”的概念，正是出于对围棋哲学本身的考虑……本文是作者对一年前在弈客发表的《如果阿法狗碰上古棋规则》一文的全面升级，看看能否给大家带来新的启示。

围棋的规则不同，对棋手的下法影响很大。如果人工智能碰上座子围棋规则，会是什么情况呢？笔者就这个问题总结了一些看法，与棋友一起探讨，欢迎指正。

座子围棋规则非常简单，开局摆放四个座子以及局后计算胜负时“还棋头”而已。当今职业棋手抑或业余棋手都很少有人研究座子围棋，因为规则变了，座子围棋技术已用不上。所以延绵数千年的座子围棋——中国古棋传承，已中断一百余年了。

当代职业棋手李喆六段在《从兼山堂到桃花泉——试述中国古代围棋棋艺的发展演变》（《围棋天地》2016年第一期）一文中谈到：
“今棋布局讲究连片，而古棋常为打散纷乱之态势。……

中国古棋布局强调分边，今棋布局强调连片，二者实为一体两面，是同一种理念的两种表现形式。造成表现形式之差异的原因主要有两点：一、今棋连片更为便易；二、古棋不惧攻角。这两点又都与规则相关。今棋取消座子，起手可不占对角星，连片较为容易。而对于攻角的价值，则与还棋头规则有关。”

有人说：“废除座子”解放了布局，是一大“进步”。其实，中国古棋的布局变化也非常多，属动态平衡的布局。《弈理指归图》言：“使敌无大块及拆三之地，布局最醇”。以清代棋圣施襄夏为代表的中国古棋人，对座子围棋的布局研究颇深。

古棋开局置放的四个座子客观上造成了棋块在棋盘上的自然分割。因为棋块不能连片，只能相互分片，所以需要处理各个棋块的强弱、虚实、攻防、取舍，极大的复杂化了中盘战斗，更易将棋局导入未知领域，也会极大地开拓、挑战棋手的思维。四个座子在一定程度上限制了先行优势；“取消座子”又导致先行优势过大，引发“到底应该贴几目”这样无解的问题。

很多人把四个座子简单地看作是“对角星布局”。“对角星布局”会导致无法连片，很大程度上降低了先行效率，所以在大贴目时代很少能见到了。一般认为：“取消座子迎来了布局解放，增加布局变化”。其实，取消座子增加了开局变化，是以开局变化的自由换来中盘变化的束缚。因为取消座子后，黑白双方更容易将棋块'连片'，下成各自围空的“连片”围棋，所谓'连片者胜'。一旦“连片”，棋的块数就少了，其变化与计算必然会比互相分割、九龙共舞的古棋局面简单许多。在“连片”围棋的局面里，A和B两个点差一路，A和B的差别就是相对简单的计算或官子目数差别，这在数学上称为“解空间平滑”。

四个座子会造成棋块的自然分割，黑白双方更容易的不是连片，而是互相分片。“还棋头”又鼓励双方互相切断，竞相出头，争夺中腹制空权，形成九龙共舞的全局关联复杂局面。所以，一旦局面换成中国古棋那种四处牵制，错综复杂的战斗场面（以及复杂的全局打劫转换过程），断和刺差一路，结果就是生与死的区别。这在数学上称为“解空间多峰且嶙峋陡峭”。

解空间平滑有利于电脑求解，其对当前人工智能(AI)来说难度较低，并不会造成算法上的困难。解空间多峰且嶙峋陡峭不利于求解，这在数学上是非常明白的。

那么，“取消座子、还棋头”是简单化还是复杂化围棋也就不言而喻了。

图1：古棋“《眉山墅隐》第十局汪汉年（白先）——周东侯之局的前22着，双方各5块棋交叉分割（合计10块棋）。这样的棋谱给下现代围棋的人会产生很大的视觉冲击。”
（摘自余位坤文《从<眉山墅隐>看中国古代围棋理论的形成》，2015年度杭州棋文化峰会之论文集《钱塘棋会》）

图2：中国古代座子围棋技术的最高峰——当湖十局第6局前25着，范西屏（白先）——施襄夏。不算棋盘下方各自挂角的棋块数，单算棋盘上方交错攻杀的黑白双方，就有7至8块棋，此后的棋局进程，攻杀之激烈也令人叹为观止。

图3：2016年末开始的AlphaGo（Master） Vs人类的网络对局之一，柯洁（白）对Master（黑先）一局的前25手，黑方大致有2至3块棋，白方大致有3至4块棋，黑方先行后“连片”趋势非常明显，黑白双方合计，至多只能算有7块棋。

图4是此后的棋局进程。“黑43尖冲，柯洁在不清楚黑意图的情况下，惯性应了第44手。黑45大飞后，柯洁选择了46,48扭断作战。”（时越、贾罡璐略评）
但其实，柯洁没有足够的时间来算清此后的变化。

至黑63手，经此役的折冲，在AlphaGo或人类高手的眼中，胜负已然确定，见图5。

图5：黑49-63简明定型。“白棋中间的四个子，无法动弹，几乎死掉。白棋在右边虽然获得了巨大的实空，但黑棋的作战获得的利益过大。”（时越、贾罡璐略评）

图6：当湖十局第6局前100着，虽然现在白方处于不利形势，但在如图双方棋子犬牙交错的局面下，让人工智能AlphaGo来下，也不一定能算得够深，算得够清吧？

座子起到“分片”的作用。“还棋头”是在“明清数子规则”下，多一块棋的一方要多付出一子的解读。而在“唐宋填空、数路”规则就是“基本眼位非目”（一块棋中赖以生存的2口气或称2个眼是基本眼位，不能算作“路”或“目”）。“还棋头”不是规则，是自然形成的围棋定律。因为“还棋头”（多出一块棋就必须多付出2目来存活），导致必须更注重中腹的控制权、向中腹出头与其它棋块联络，鼓励切断，鼓励战斗。

现代围棋取消了“还棋头”，所以棋块可以搞独立据点，不十分强调向中腹出头与联络。古代《棋经十三篇》载：“高者在腹，下者在边，中者占角，此棋家之常然也”就失去了意义，日本棋谚“金角银边草肚皮”大行于世。导致人类棋手与AlphaGo对局的时候突然发现，原来中腹是这么重要。可以“笼罩局上，以为阵势，成则攻也”（敦煌《碁经》附梁武帝《碁評要略》文，见图7），

图7

也可以下在5路尖冲（AlphaGo VS李世石第2局，见图8）。

图8

我们来看清代棋圣施、范的棋，全局关联，攻击、反扑一波接一波。仍以当湖十局第6局为例，陈祖德九段《当湖十局细解》评：“黑160位靠，粗看使人莫名其妙，细算才发现奥妙无穷。” 黑160居然与上面的2块死棋复活有着某些联系，像黑160的“靠”，细细品味，会发现有些类似于李世石战胜AlphaGo的那手“挖”（见图11）。

图9

陈祖德九段在书中摆出以下3个变化图，演示了黑160的精妙所在。（见图10）

图10

再看阿法狗(AlphaGo) Vs 李世石人机大战的前四局，李世石每次都在大局上被阿法狗所左右，到处疲于奔命、不能发挥“僵尸流”的特点，完全发不出力。一方面是阿法狗的形势判断、大局控制能力确实强，另一方面，难道没有其它的原因，让李世石无从发挥他的长处？一旦李世石绝地求生，第4局走出类似中国古棋的错综复杂局面，78手凌空一挖（图11），似做劫而未做劫，似开吃而又未开吃，一举击中阿法狗的短板，阿法狗的神经就开始错乱了。

图11
郑宇、张钧波《一张图看懂：Google AlphaGo的原理、弱点》一文谈到：“在线对弈过程包括5个关键步骤：其核心思想是在蒙特卡洛搜索树(MCTS)中嵌入深度神经网络来减少搜索空间。AlphaGo并没有具备真正的思维能力。…”
两人文中在谈到如何击败AlphaGo时，其中的一条建议是：“1、攻其策略网络，加大搜索空间。进入中盘后，职业选手如能建立起比较复杂的局面，每一步棋都牵连很多个局部棋的命运(避免单块、局部作战)，则AlphaGo需要搜索空间则急剧加大，短时间内得到的解的精度就会大打折扣。李世石九段的第四局棋就有这个意思。此处左右上下共5块黑白棋都相互关联到一起，白1下后，黑棋需要考虑很多地方。很多地方都需要在MCTS上进行跟深入的搜索。为了在一定的时间内有结果，只能放弃搜索精度。…”
（引自： https://www.techweb.com.cn/digitallife/2016-03-16/2297848.shtml）

看来，如按座子围棋规则下，人工智能(AI)会困难些吧。

按现代规则下，对方棋一旦连片，打入一方就困难了。比起座子围棋因无法连片而只能互相分片，导致棋块九龙共舞的局面；现代“连片”围棋的复杂度大大降低。座子围棋的“还棋头（基本眼位非目）”迫使双方竞相向中央出头联络，鼓励切断对方的棋子、鼓励战斗，而“连片”围棋将“基本眼位算作目”，又降低了棋局的激烈程度。
从原理来讲，AlphaGo无法穷尽围棋的变化，是利用神经网络进行合理的剪枝后选点，并进行形势判断。既然AlphaGo运作的核心思想是在蒙特卡洛搜索树(MCTS)中嵌入深度神经网络来减少搜索空间。那么，战胜AI比较大的一个机会，在于破解蒙特卡洛算法。

为什么座子围棋——中国古棋规则有助于破解蒙特卡洛算法？为什么AI可以在“连片”围棋领域里会胜过人类？前面提到的数学分析上可以解释这一点，再重复一下：
这是因为在“连片”围棋的局面里，A和B两个点差一路，A和B的差别仅仅是相对简单的计算或官子目数差别，这叫“解空间平滑”；“解空间平滑”有利于电脑求解，其对当前人工智能(AI)来说难度较低，并不会造成算法上的困难。而一旦局面换成座子围棋那种四处牵制，错综复杂的战斗场面，断和刺差一路，结果就是生与死的区别，这叫“解空间多峰且嶙峋陡峭”；“解空间多峰且嶙峋陡峭”不利于AI求解。这在数学上是非常明白的。

“连片”围棋很不巧，没有很好体现围棋的混沌性质，只有座子围棋——全局关联围棋最充分地体现了围棋的混沌，也就是体现了围棋的真谛。在数学上，混沌是不可解的！所以混沌的围棋，也是不可解的！这不是电脑改进算法就可以改变的事实。

因此，在座子围棋规则下战胜AI的策略如下：

首先，人类要下整体围棋，在中盘前让整体局面不落后很多。其次，要制造复杂局面，让计算的手数尽量长，分支尽量多。而且最好包括打劫，这是有原理上的依据的，计算机每一步搜索都要消耗资源，打劫会极大增加计算机搜索难度，这是毫无疑问的。计算手数长，计算机搜索出错的概率就大，这就好比蝴蝶翅膀的煽动要依靠从南美巴西到北美德克萨斯州那么远的距离去放大，才能成为风暴！距离是关键。

同理，要放大AI的错误，一个足够长的计算链条是必须的。复杂局面往往范围大，选点多，这样极大考验计算机剪枝算法。然而，根据混沌理论，计算链条足够长则计算机出错几乎必然。所以我们看到，当李世石在第4局第78手把局面搞复杂到一定程度后，AI就露馅了。据报道，谷歌工程师坦言：已修复在这个棋局局面下，这个特定的Bug（错误），但无法全面修正类似这样的其它Bug。

反过来，我们明白了“连片”围棋为什么不行。

所以，在座子围棋规则下，人类应不易被AI轻松击溃。因为头绪多，AI限于算法无法深层计算变化，古棋谱样本又少。无论棋谱学习还是自主学习，一旦导入未知领域，AI都有可能比不过人类用千百年总结出的抽象原则去指导作战，首先，这个人类代表必须是天才的人类代表。当然，我们也必须看到，在AI进化到一定程度后，也许是人脑永远也无法超越的。
看来，围棋规则对于围棋棋理、棋风以及棋局复杂度的影响，是本质的。开局设置的座子使棋块相互分割，起着张力的作用；“还棋头（基本眼位非目）”又有一股自然的合力，一张一合之间，犹如强弓拉开后利箭射出。座子围棋——中国古棋之高妙，正在于此。

两次人机大战给围棋界提供了一个很好的反思契机。特别是在传承中华优秀传统文化——座子围棋，以及对古棋规则的再思考这些方面。

感谢：群友“先天武道低手”对此文的帮助。

附：
中国现代座子围棋规则
(Version 0.9 于2017-1-27)

1、先于棋盘四角四四位分定座子（黑白各2个座子，呈中心对称状）。白方先行。
注：座子是古棋的开局方式，表示“四象”，体现了中国古代宇宙观及哲学思想。
   开局四个座子可防止先行方棋子连片成势，也在一定程度上降低了先着优势。

2、气的概念非常重要，“有气则生，无气则亡，气尽子提。同时无气，落子一方提对方无气棋子”。如果棋子或棋块没有气，应立即从棋盘上被提走，由对方俘获。双方同时无气，下子一方俘获另一方的棋子。

3、一方一手、交替下子，不得放弃（允许虚手，交一俘虏）、等手终局。
   3.1 允许虚手,虚手(pass)时将己方棋子一枚直接交给对方俘获，以平衡手数。
   3.2 为体现等手终局的原则，终局时应平衡手数。即：先下一方收后的情况下，后下一方应虚手一次。

4、无禁着点的规定,允许个子或块子自尽。
注：按奥卡姆剃刀原理“如无必要，勿增实体”的原则，不人为规定禁着点。

5、贴子或贴目：按古棋规则，严格上说，没有贴子或贴目。
   5.1 建议双方轮流先行，两局后计算总胜负；如胜负仍未定，按用时多少决定胜负。
   5.2 如只能以一局定胜负，考虑到先下方的先行优势，可规定贴子或贴目。
      比如：先下方（白）盘面多1子或2目以上胜。

6、普通劫的规则按约定俗成，三劫、四劫循环等情况,参照古棋约定俗成，按和棋处理。
（另：因计算机技术的提高，可实现由计算机来判断并禁止全局同形再现，因此也可在对局前规定禁止超级劫即禁止全局同形再现）

7、没有其它的附加规则了（由实战解决争议）。

8、终局方式
   8.1 协议终局：中盘认输（可按差距30目以上计算）；
   8.2 判断终局：双方两虚手或三虚手后，进入计算胜负阶段。
    胜负判定的标准是：“子多为胜”。
（注1：古棋规则重要的内容是：棋子或棋块赖以生存的气不属于任何一方以下是古棋规则的验证推论过程。在走完最后一个单官后,双方仍可一人一手(可虚手)继续下子,填满棋盘上的虚空。填子过程是已省略掉的自然（两溢）终局过程，棋子或棋块赖以生存的眼或公气会保留不填。因此,填满虚空不包括填掉棋块赖以生存的气眼。但规则理论上不禁止填满，比如：有人发疯想输掉对局。最新古棋研究表明，古棋规则的源头是“两溢后俘子多为胜”，即：吃子棋规则。
注2：在某些极特殊的情况下，吃掉对方的棋子，己方损失反而更大，那么１口气的棋块也能存活。（见赵之云《围棋实战指南》一书相关文章中的例图）

9、胜负判定方式（以下2种胜负判断方法是等价的）：
   9.1 明清数子法：根据以上推论的简便计算方法,采用还棋头的方式，以归本数180.5+贴子的方式计算。实质是：生存于棋盘上的棋子多的一方胜。
   9.2 唐宋数路法:根据以上推论的简便计算方法，回填俘子后，再计算双方的空（不包括赖以生存的气眼），空点多的一方胜。
   9.3 某些情况下可考虑因先行方收后的优势的原因，“先行方局终三虚手胜”逊于“先行方局终二虚手胜”。

全文完。