如果把这4步棋涉及的5个局面都告诉引擎,那么指令依次是:
position fen rnbakabnr/9/1c5c1/p1p1p1p1p/9/9/P1P1P1P1P/1C5C1/9/RNBAKABNR w - - 0 11:
position fen rnbakabnr/9/1c5c1/p1p1p1p1p/9/9/P1P1P1P1P/1C5C1/9/RNBAKABNR w - - 0 1 moves h2e22:
position fen rnbakabnr/9/1c5c1/p1p1p1p1p/9/9/P1P1P1P1P/1C5C1/9/RNBAKABNR w - - 0 1 moves h2e2 h7e73:
position fen rnbakabnr/9/1c2c4/p1p1C1p1p/9/9/P1P1P1P1P/1C7/9/RNBAKABNR b - - 0 24:
position fen rnbakabnr/9/1c2c4/p1p1C1p1p/9/9/P1P1P1P1P/1C7/9/RNBAKABNR b - - 0 2 moves d9e85:
其中第4行更换了FEN串,因为该局面前一个着法是吃子着法。
五、指令和反馈
按照惯例,指令用红色表示,反馈用蓝色表示。
ucci1.
引导状态的指令。这是引擎启动后,界面需要给引擎发送的第一条指令,通知引擎现在使用的协议是UCCI。
>信息id {name | copyright | author | user} < 2.
引导状态的反馈。显示引擎的版本号、版权、作者和授权用户,例如:
,说明引擎的版本号是ElephantEye 1.6 Beta;id name ElephantEye 1.6 Beta
,说明引擎的版权属于www.所有;id copyright 2004-2006 www.
,说明引擎的作者是Morning Yellow;id author Morning Yellow
,说明引擎授权给用户ElephantEye Test Team使用。id user ElephantEye Test Team
>]默认值> [...]]] [default < 可选项> [var <可选项>] [var <最大值>] [max <最小值> [min <类型> type <选项option <3.
(字符串)中的一种。string(整数)、spin(多选项)、combo(是或非)、check(指令)、button(标签,非选项)、label指选项的名称(后面会介绍),选项的类型是<option> 引导状态的反馈。显示引擎所支持的选项,
通常的UCCI引擎支持以下选项:
的指令。目前已知的UCCI界面程序(如象棋巫师、UCCI引擎联赛模拟器等)都采用这种做法;setoption usemillisec true 的反馈信息,否则界面将自动使用毫秒模式,并向引擎发送option usemillisec ... 的反馈信息。除非引擎不发送 option usemillisec ... 前输出ucciok指令的时间单位是“毫秒”),并总是在go,通知界面采用毫秒模式。建议引擎始终采用毫秒模式(即usemillisec(check) (1)
,批处理模式(前面介绍过),默认是关闭的;batch(check) (2)
反馈),以帮助调试;info,调试模式,默认是关闭的,打开后引擎会输出更多的信息(debug(check) (3)
指令;ponderhit和go ponder,是否使用后台思考的时间策略,默认是关闭的,设定该参数的目的仅仅是让引擎改变时间分配策略,而后台思考则仍然需要界面发出指令,参阅ponder(check) (4)
,是否使用开局库的着法,默认是启用的,如果关闭的话,即便当前局面在开局库中有着法,引擎也会不顾开局库而思考的;usebook(check) (5)
类似;usebook,是否使用残局库,默认是启用的,和useegtb(check) (6)
设成空值;bookfiles选项外,还可以把usebook,设定开局库文件的名称,可指定多个开局库文件,用分号“;”隔开,如不让引擎使用开局库,除了可以关闭bookfiles(string) (7)
类似;bookfiles,设定残局库路径的名称,和egtbpaths(string) (8)
类似,但只能是一个文件(例如,Windows下默认值是EVALUATE.DLL,Linux下默认值是libeval.so);bookfiles,设定局面评价API函数库文件的名称,和evalapi(string) (9)
,以MB为单位规定Hash表的大小,0表示让引擎自动分配Hash表;hashsize(spin) (10)
,支持多处理器并行运算(SMP)的引擎可指定线程数(即最多可运行在多少处理器上),0表示让引擎自动分配线程数;threads(spin) (11)
(低符合)四种选项,引擎默认总是以满负荷状态运行的,而设置比较大的空闲状态,可以在人机对弈时留出适当的处理器资源,让用户运行其他程序;large(中负荷)、medium(高负荷)、small(满负荷)、none,设定处理器的空闲状态,通常有idle(combo) (12)
,是否允许仕(士)相(象)升变成兵(卒),这是一种中国象棋的改良玩法,默认是不允许的(即默认采用常规走法);promotion(check) (13)
;none或small不一定能解出,可尝试medium或large以充分展示引擎的搜索速度,但在处理一些刁难性的排局时,用large(大)四种,一般都设为large(中)、medium(小)、small(无)、none,设定裁剪程度,裁剪越多则引擎的搜索速度越快,但搜索结果不准确的可能性越大,通常有pruning(combo) (14)
,但在解杀局时不需要静态局面评价,可以把知识量设置得小些;large一样有四种设定,一般都使用pruning,设定知识大小,通常知识量越多则程序的静态局面评价越准确,但的运算速度会变慢,该选项和knowledge(combo) (15)
,以保证引擎走出它认为最好的着法,但为了增强走棋的趣味性,可以把这个参数调高,允许引擎走出它认为不是最好的着法,以丰富走棋的样式;none一样有四种设定,一般都设为pruning,设定随机性系数,和randomness(combo) (16)
(冒进)三种;risky(均衡)和normal(保守)、solid,设定下棋的风格,通常有style(combo) (17)
这条指令。setoption newgame ,设置新局或新的局面,引擎收到该指令时,可以执行导入开局库、清空Hash表等操作,UCCI界面《象棋巫师》在每次新建棋局或重新编辑局面时都会发送newgame(button) (18)
等选项的设置(它们只供调试时使用)。debug、batch 需要注意的是,各种引擎提供的选项内容是不一样的,也并不是所有的UCCI界面支持这些选项的,例如目前的UCCI界面《象棋巫师》没有对
ucciok4.
引导状态的反馈,此后引擎进入空闲状态。
isready5.
,该指令仅仅用来检测引擎是否能够正常接收指令。readyok 空闲状态和思考状态的指令。检测引擎是否处于就绪状态,其反馈总是
readyok6.
空闲状态和思考状态的反馈。表明引擎处于就绪状态(可正常接收指令)。
>]值> [<选项setoption <7.
反馈的参数,例如:option 空闲状态的指令。设置引擎参数,这些参数都应该是
,不让引擎使用开局库;setoption usebook false
,把选择性设成最大;setoption selectivity large
,指定冒进的走棋风格;setoption style risky
,初始化开局库。setoption loadbook
指令。setoption反馈,而直接根据用户的设置发送option反馈没有给出的参数,并不会出错。例如UCCI界面《象棋巫师》就从不识别option 但是,设置
>]后续着法列表> | startpos} [moves < 串position {fen <FEN8.
后面跟的是随后走过的着法,例如:moves来指定FEN格式串,fen 空闲状态的指令。设置“内置棋盘”的局面,用
moves h2e2 h9g7 position fen rnbakabnr/9/1c5c1/p1p1p1p1p/9/9/P1P1P1P1P/1C5C1/9/RNBAKABNR w - - 0 1
》一文。中国象棋电脑应用规范(三):FEN文件格式 FEN格式串的写法参阅《
选项列出该局面到当前局面的所有着法。moves选项为最后一个吃过子的局面(或开始局面),然后fen选项是为了防止引擎着出长打着法而设的,UCCI界面传递局面时,通常moves
。fen rnbakabnr/9/1c5c1/p1p1p1p1p/9/9/P1P1P1P1P/1C5C1/9/RNBAKABNR w - - 0 1 表示开始局面,它等价于startpos
>禁止着法列表banmoves <9.
空闲状态的指令。为当前局面设置禁手,以解决引擎无法处理的长打问题。当出现长打局面时,棋手可以操控界面向引擎发出禁手指令。例如:
position fen 1r2kab1r/2c1a4/n1c1b1n2/4p2N1/p1p6/1C4P2/P1P1P4/2N1B3C/4A4/1RBAK2R1 w - - 0 1 moves h6i4 i9h9 i4h6 h9i9
banmoves h6i4
指令后,前面设置过的禁止着法就取消了,需要重新设置禁止着法。position》(1999年版)棋例图三,由于大多数象棋引擎无法识别红方这种方式的长捉,所以在采用中国象棋协会的比赛规则时,遇到这种局面就必须给引擎发出禁手指令。下一次发送象棋竞赛规则 本例取自《
指令。banmoves 目前UCCI界面《象棋巫师》不识别长打禁手,所以不会向引擎发送
>思考模式go [ponder | draw] <10.
指令设定的棋盘来思考,各选项为思考方式,有三种模式可供选择:position 空闲状态的指令,此后引擎进入思考状态。让引擎根据
。nobestmove指令中止)。如果深度设定为0,那么引擎可以只列出当前局面静态评价的分数,并且反馈stop表示无限制思考(直到找到杀棋或用infinite:限定搜索深度,> | infinite深度depth < (1)
:限定搜索结点数。>结点数nodes < (2)
可以让界面把对方的用时情况告诉引擎。oppincrement和oppmovestogo、opptime适用于加时制。increment适用于时段制,movestogo:限定时间,时间单位是秒(默认)或毫秒(启用毫秒制时),>]]对方每步加时> | oppincrement <对方剩余步数> [oppmovestogo <对方时间>] [opptime <每步加时> | increment <剩余步数> [movestogo <时间time < (3)
指令后才计时,该选项用于后台思考,它只对限定时间的思考模式有效。ponderhit选项,则引擎思考时时钟不走,直到接受到ponder 如果指定
指令。bestmove提供的选项作为反馈,参阅bestmove选项表示向引擎提和,引擎以draw 指定
指令。ponderhit draw选项不能同时使用,如果界面向正在后台思考中的引擎求和,则使用draw和ponder 注意:
>思考信息info <11.
思考状态的反馈。显示引擎思考信息,通常有以下几种信息:
&g已花费的时间time < (1) t; nodes <已搜索的结点数>:思考信息中给出的时间通常以毫秒为单位,结点数和时间相除就是引擎的速度(NPS值),单位是K。
(2) depth <当前搜索深度> [score <分值> pv <主要变例>]:输出引擎思考到的深度及其思考路线和好坏。例如在起始局面下,《象棋巫师》收到引擎的反馈:info depth 6 score 4 pv b0c2 b9c7 c3c4 h9i7 c2d4 h7e7,那么界面上应该输出:6 (+4) 马八进七 马2进3 兵七进一 马8进9 马七进六 炮8平5。分值通常以一个轻子(马或炮)为100分记,以上信息说明此时当前要走的一方占有相当于0.04个轻子的优势。
(3) currmove <当前搜索着法>:输出引擎正在思考的着法。
(4) message <提示信息>:输出引擎要直接告诉用户的信息,建议界面程序直接将提示信息显示在界面上。
12. ponderhit [draw]
思考状态的指令。告诉引擎后台思考命中,现在转入正常思考模式(引擎继续处于思考状态,此时go指令设定的时限开始起作用)。
指定draw选项表示向引擎提和,引擎以bestmove提供的选项作为反馈,参阅bestmove指令。
13. stop
思考状态的指令。中止引擎的思考。另外,后台思考没有命中时,就用该指令来中止思考,然后重新输入局面。
注意:发出该指令并不意味着引擎将立即回到空闲状态,而是要等到引擎反馈bestmove或nobestmove后才表示回到空闲状态,引擎应尽可能快地作出这样的反馈。
14. bestmove <最佳着法> [ponder <后台思考的猜测着法>] [draw | resign]
思考状态的反馈,此后引擎返回空闲状态。显示思考结果,即引擎认为在当前局面下的最佳着法,以及猜测在这个着法后对手会有怎样的应对(即后台思考的猜测着法)。通常,最佳着法是思考路线(主要变例)中的第一个着法,而后台思考的猜测着法则是第二个着法。
在对手尚未落子时,可以根据该着法来设定局面,并作后台思考。当对手走出的着法和后台思考的猜测着法吻合时,称为“后台思考命中”。
draw选项表示引擎提和或者接受界面向引擎发送的提和请求,参阅go draw和ponderhit draw指令。resign选项表示引擎认输。UCCI界面在人机对弈方式下,根据不同情况,可以对引擎的bestmove反馈中的draw和resign选项作出相应的处理:
(1) 如果用户提和,界面向引擎发出go draw或ponderhit draw指令,而引擎反馈带draw的bestmove,那么界面可终止对局并判议和;
(2) 如果用户没有提和,而引擎反馈带draw的bestmove,那么界面可向用户提和,用户接受提和则可终止对局并判议和;
(3) 如果引擎反馈带resign的bestmove,那么界面可终止对局并判引擎认输。
引擎应该根据当前局面的情况(由position指令给出),以及界面是否发送了带draw的go或ponderhit指令,来考虑是否反馈带draw或resign的bestmove。
15. nobestmove
思考状态的反馈,此后引擎返回空闲状态。显示思考结果,但引擎一步着法也没计算,表示当前局面是死局面,或者接收到诸如 go depth 0 等只让引擎给出静态局面评价的指令。
16. probe {fen <FEN串> | startpos} [moves < 后续着法列表>]
空闲状态和思考状态的指令。获取Hash表中指定局面的信息,引擎必须立刻在Hash表中查找该局面的状态,由pophash指令反馈。
该指令仅用于引擎的调试,设计者可以向引擎发送一系列probe指令,捕获到搜索树的大致信息。
17. pophash [bestmove <最佳着法>] [lowerbound <Beta值> depth <深度>] [upperbound <Alpha值> depth <深度>]
空闲状态和思考状态的反馈。输出由probe所指定的局面在Hash表中信息。
如果该局面没有记录在Hash表中,那么只反馈pophash即可。
18. quit
空闲状态的指令。让引擎退出运转。
19. bye
接收到quit指令后的反馈。引擎完成了退出运转前的准备工作,通知界面,引擎将在瞬间正常退出运转。界面收到该指令后,即可关闭输入输出通道。
六、用例
下面是一个后台思考的例子,描述了UCCI引擎中最难处理的部分。(从界面到引擎的)指令用红色表示,(从引擎到界面的)反馈用蓝色表示。
ucci
id name ElephantEye Demo
option usemillisec type check default false
option usebook type check default true
ucciok
setoption usemillisec true
setoption usebook false
position fen rnbakabnr/9/1c5c1/p1p1p1p1p/9/9/P1P1P1P1P/1C5C1/9/RNBAKABNR w - - 0 1
go time 300000 increment 0
info depth 6 score 4 pv b0c2 b9c7 c3c4 h9i7 c2d4 h7e7
info nodes 5000000 time 5000
bestmove b0c2 ponder b9c7
在这个例子中,引擎执红,用户执黑,采用5分钟包干的时限。引擎启动后,界面即让引擎分析初始局面(不用开局库),引擎给出最佳着法“马八进七”,然后是用户走子,引擎按照猜测着法“马2进3”作后台思考。此时,引擎消耗了5秒钟,还剩余295秒的时间。
position fen rnbakabnr/9/1c5c1/p1p1p1p1p/9/9/P1P1P1P1P/1C5C1/9/RNBAKABNR w - - 0 1 moves b0c2 b9c7
go ponder time 295000 increment 0
info depth 6 score 4 pv c3c4 h9i7 c2d4 h7e7 h0g2 i9h9
此时用户走子了,下面分两种情况讨论。
(1) 如果用户走了引擎的猜测着法“马2进3”,那么后台思考命中:
ponderhit
info nodes 10000000 time 10000
info depth 7 score 4 pv c3c4 h9i7 c2d4 h7e7 h0g2 i9h9 i0h0
info nodes 15000000 time 15000
bestmove c3c4 ponder h9i7
现在引擎走“兵七进一”,并且猜测对方会走“马8进9”。尽管这着棋引擎思考了15秒钟,但是前10秒钟用的是对手的时间,自己的时间是从ponderhit到bestmove的部分,所以自己的时间只消耗了5秒钟,因此还剩余290秒的时间。然后引擎继续后台思考。
position fen rnbakabnr/9/1c5c1/p1p1p1p1p/9/9/P1P1P1P1P/1C5C1/9/RNBAKABNR w - - 0 1 moves b0c2 b9c7 c3c4 h9i7
go ponder time 290000 increment 0
……
(2) 如果用户走了其他的着法(比如“卒3进1”),那么后台思考没有命中,必须根据这个着法重新思考。
stop
info nodes 10000000 time 10000
bestmove c3c4 ponder h9i7
position fen rnbakabnr/9/1c5c1/p1p1p1p1p/9/9/P1P1P1P1P/1C5C1/9/RNBAKABNR w - - 0 1 moves b0c2 c6c5
go time 295000 increment 0
……
如希望获得更详细的关于UCCI操作上的细节,可参考UCCI引擎ElephantEye的源程序及其说明材料,这里不再作过多的介绍。
七、电脑象棋联赛
电脑象棋联赛使用UCCI引擎,但是参赛引擎并不一定要支持UCCI的全部内容,只需要能跟“UCCI引擎联赛模拟器”正常通讯就可正常比赛了,模拟器相当于一个支持UCCI的界面。参赛引擎必须能够识别并正确处理的指令有:
(1) ucci;
(2) position fen ... [moves ...];
(3) banmoves ...;
(4) go [draw] time ... increment ... [opptime ... oppincrement ...];
(5) quit。
参赛引擎必须能够反馈的信息有:
(1) ucciok;
(2) bestmove ... [draw | resign]。
为了更好地让引擎适应模拟器,引擎最好能够实现以下功能:
(1) 支持毫秒制。即启动时有option usemillisec的反馈,能够识别并处理setoption usemillisec true的指令。启用毫秒制以后,在时间非常紧缺的情况下,模拟器就会准确地把时间告诉引擎,否则只会粗略地给出秒数。
(2) 支持认输和提和,即当引擎觉得没有机会获胜时,可以用bestmove ... draw提和或接受提和,当引擎觉得没有能力抵抗时,可以用bestmove ... resign认输,节约比赛时间。
(3) 支持stop指令。当引擎超时后,模拟器会发送stop指令让引擎立即给出着法(立即反馈bestmove),超过一定时间(如超过0.2秒)才判超时负。
另外,识别setoption指令不是必须的,但在联赛中也会有用。例如,如果引擎需要用setoption bookfiles ...来导入开局库,而模拟器不会自动向引擎发送这条指令,那么引擎必须建立配置文件,其中有setoption bookfiles ...这行指令,模拟器在启动引擎后,会把配置文件中的每行都作为指令发送给引擎的。
八、和UCI的区别
UCCI是从国际象棋通用引擎协议UCI移植过来的,沿用了大部分UCI的指令和反馈,但是为了适应中国象棋软件的需要,作了以下几点改动:
(1) 增加了banmoves指令,因为中国象棋有长打作负的规则。
(2) 把UCI的反馈option name <选项> type <类型> ...简化为option <选项> type <类型> ...。例如,UCI中有option name Hash Size type spin这条反馈,而在UCCI中则是option hashsize type spin。这里去掉了name关键字,因为它总是跟在option后面,显得多此一举。另外,UCI允许选项由多个有大小写的单词组成(如Hash Size),这是因为UCI界面会直接把这个选项名称显示在对话框上。而UCCI中的选项只用一个全部由小写字母组成的单词,因为中国象棋的UCCI界面使用中文,因此界面上不能输出Hash Size,而用“置换表”或其他可以看得懂的中文术语。这样,界面还不如识别一个更简单的hashsize(一个全部由小写字母组成的单词),再翻译成“置换表”。
(3) 把UCI的指令setoption name < 选项> [value <值>]简化为setoption <选项> [<值>]。由于UCCI的选项是一个单词,所以第二个空格后的内容肯定是选项的值,因此name和value就显得多此一举了。
(4) UCCI明确了引擎所处的三种状态,以及这三种状态下适用的指令和反馈,为界面和引擎的程序设计提供了清晰的思路。
(5) UCCI以go time <时间> opptime <时间>的形式把双方的时间信息传达给引擎,而不是UCI的go wtime <时间> btime <时间>,这样可以简化引擎解析时间的操作,如果引擎在指定用时策略时不考虑对方的用时,那么可以不理会opptime <时间>。
(6) UCCI明确了4种思考模式,使得指令的解析简单化了。
(7) UCCI规定position fen ... [moves ...]指令中的FEN串是当前局面前第一个不吃子的局面,后面再跟该局面的后续着法。而UCI则是用position startpos moves ...指令,把棋局从头到尾的着法全都列出来,会增加通讯通道的压力。