分享

从清华园走出的第一位德州扑克世界冠军

 lj0279 2021-03-07

2016年世界德州扑克大赛夺冠札记及其他

各位同学好,我是杜悦,就读于清华大学计算机系1986级3班。再过两个月,就逢清华110年校庆以及我们1986级校友毕业30年庆。在几位老同学撺掇下,我忍不住心动,也想写点东西,聊聊2016年7月我在美国LasVegas举办的世界德州扑克大赛获得冠军金手链和冠军奖金$800,856的经历,以及其他一些有关德州扑克的东东,希望能给咱们86级毕业30年庆专刊增加点杂谈趣闻。
我是重庆人,在重庆我们把闲谈杂聊吹牛叫做“摆龙门阵”,希望各位老同学阅读此文时,权且当成是“听龙门阵”哈。在此谢谢各位的捧场先!

图一:2016年7月,WSOP夺得冠军金手链和奖金$800,856,现场华人牌手同庆祝

先简单介绍下世界德州扑克大赛,英文WorldSeriesofPoker,简称WSOP,每年6/7月份在世界娱乐之都LasVegas举行,到目前为止已举行了50届(最近的2020年因为新冠疫情没有举办)。WSOP是公认的世界最顶级的德州扑克赛事,每年6/7月份,来自世界各地的德州扑克爱好者(无论专业的,还是业余的牌手)云集Vegas,掏出自己的积蓄,热情参与各项德州扑克赛事,最近的2019年的WSOP有约20万人次参与,每年的WSOP绝对是扑克爱好者的顶级花年华。

在一生中去Vegas参与至少一次WSOP赛事,可谓是每一位德州扑克爱好者的朝圣之行,皆心向往之!(我粗粗地估算一下,每年的各项赛事报名费累计,预算小穷一点的选手得花几千美金,预算宽松一些的得花小几万美金,土豪或顶级职业选手得准备小几十万美金。)

图二:2016年世界德州扑克大赛WSOP冠军金手链

作为德州扑克的深度爱好者,我自然不能免俗,多年来一直向往能够去Vegas参加WSOP的花年华。终于在2016年夏,趁从北京回美国度假期间,我安排出了时间来到了Vegas。2016年是我第1年参加WSOP,我获得冠军的那项赛事是报名费5000美刀的无限注德扑,是我当年参加的第5项赛事。那年该项赛事参赛选手863名,因为报名费比较高,参赛者大多是各国的顶尖高手,冠军奖金多达80万美刀。鏖战4天,每天10小时,最终我侥幸获胜夺冠。 

按WSOP的统计,我应该是历史上全球华人里第三位获得WSOP冠军金手链的。可以负责任并且带点小自豪的说,我是清华历史上第一位拿到WSOP冠军金手链的!

我的德州扑克成长之路

第一次接触到德州扑克,是1999年秋我刚进入美国斯坦福大学商学院读MBA的时候。德州扑克是欧美大众娱乐文化里的重要一分子,其在美国的普及性堪比麻将在中国哈!德州扑俱乐部基本上是美国大学的标配之一。(写到这儿,不由得回想起当年在清华研究生楼14#楼,熬夜鏖战麻将四方城,第二天早上喝豆浆啃油条的幸福美好时光。。。)在斯坦福读书,我接触并培养了两个“不良”爱好(所谓不良爱好,主要指耗时,耗钱,上瘾,偶尔耽误事儿),其一为德州扑克,其二为高尔夫。一晃几十年,依然还在持续地爱好这两项,可谓真爱乐此不疲。有趣的现象是,对德州扑克,我自认为也被世人认可为高手;对高尔夫,我自我定位也被球友们认可为菜鸟,人皆可欺的样子。可见一个人的爱好与其是否真正擅长并没有太强的关联性。当然了,如果你的爱好碰巧是你之擅长,两者相得益彰,某天出现傲娇的成绩便成了大概率事件。

这龙门阵似乎扯得有点远了,拉回到德州扑克这个话题。从1999年秋接触德州扑克开始,到2016年WSOP上夺取世界冠军,我在德州扑克的道路上其实很顺,相比绝大多数的德扑爱好者而言少走了很多弯路。回想起来,我觉得重要的有三点:

其一,真正学透了一门课。这门课就是“概率论和数理统计”,前后累计我共学习了三遍,第一遍是在清华本科,第二遍在美国明尼苏达大学研究生院,第三遍在斯坦福大学商学院。(不好意思地解释一下,当年重复学习多遍,主要是为了偷懒混便宜学分)。有趣的是,学第一遍时,考试成绩最好;第二遍时,成绩次之;学最后一遍时,成绩最差。但是,对“概率论”中一些最基本的概念,比如概率Probability,期望值EV,方差Deviation等等,每学一遍,sense就越好。为什么在这里提到概率论中的这些基本概念呢?那是因为:在德州扑克里,(1)一个好的策略一定是一个正EV的策略;(2)一个更好的策略,通常是在正EV的前提下方差较小的策略。在德州扑克里,一个重要的基本原则就是,尽量避免做“负EV”的事儿。

其二,有一个很好的mentor。很幸运,接触德州扑克伊始,我就有了一个很好的mentor,让我在德州扑克的成长道路上走得较顺,少交了很多的学费。我的mentor是我的老同学和好朋友,他叫张淮,也是我们清华1986级的校友,是我在计算机系的本科同年级同学和研究生同班同学。我在加州硅谷的时候,张淮碰巧也在,我们经常讨论德州扑克里的疑难牌例,分享对德州扑克的一些根本理解。张淮最擅长的是德州扑克里的有限注德扑LimitedPoker,他在LimitedPoker上的水平,应该是属于世界顶级!我喜欢也比较擅长的是德州扑克里的无限注德扑No-LimitedPoker,这两种德州扑克规则略有不同,但其根本的牌理是一致的。有幸和张淮做同学和朋友,让我在琢磨德州扑克的过程中,受益匪浅!在此表示诚挚的谢意!

其三,在博弈论的高度掌控德州扑克。刚接触德州扑克不久,我有幸在加州硅谷深度参与了一个学术科研项目,项目的核心是:从博弈论看德州扑克。项目的指导顾问是一位博弈论领域的学术大拿,斯坦福大学的运筹学教授。项目组有几位核心成员,碰巧都是清华大学的校友,其中就有前面提到的张淮同学,以及在斯坦福拿到博士的清华计算机系86级少年班的张立同学。在大约两年的时间里,在斯坦福大拿教授的指导下,我们对德州扑克在理论层面上的理解可谓是彻头彻尾的彻底!特别是对博弈论中纳什均衡NashEquilibrium理论在德州扑克中的应用,以及对德州扑克中的GameTheoryOptimal(俗称GTO)策略有了深刻的理论层面的理解。(顺便提一下,NashEquilibrium理论的发明者就是电影“BeautifulMind”里的主角,Princeton大学的那位疯子天才数学教授JohnNash)。这些理论层面的研究,让我深刻地认识到,德州扑克牌手的最高境界乃是:以我之不败战敌之可胜!(解释一下就是:通过采用均衡的控制力超强的GTO策略,可把己方摆在一个不败之地,等待或迫使对手犯错以胜之)

2016年7月WSOP夺冠札记

俗语说:出大成绩者,多半是强实力碰上了大气运!

在我夺冠的那项 WSOP 赛事上,中场出了一手特别奇葩的牌。我的手牌是一对 8,pre-flop,我 raise,有一个印度裔选手 call,其余人fold,只剩两人进入 flop;在 flop 上发出10/6/2杂色,我 check,印裔选手bet,我正准备 call。。。。。。这个时候发生了一件怪事儿, dealer 是一位白人大胖子,我坐在 9 号位紧靠在 dealer 座位边,白大胖 dealer 似乎没有注意到旁边相对瘦小的我,还没有等我 action,就啪的一下快速的把 turn 牌发了出来,那是一张红桃8,全桌人都很诧异于这位职业 dealer 的业余失误,怎么会提前把 turn 牌发了出来?我更是心里一紧,那可是一张 8 啊,正好和我的手牌一对 8 组成了 set 8(三条8),这可是极强的牌力啊!我的心里随即是巨大的失落,我知道:按比赛规则,因为 dealer 误操作,这张 turn 牌不算,要重发一张新的 turn 牌。我的心里啊,那时真的是紧张/失落/愤怒,五味杂陈。。。但somehow,那时的我面无表情非常淡然,仿佛那种红桃 8 和我没有丝毫关联的小样子 。。。。。。压抑住内心的荡漾做平静状,我完成了 flop 的call;按比赛发牌细则,大白胖 dealer 暂时没有处理那张红桃 8,继续发出了 turn牌,是一张杂色的 K,我check,印度裔选手下重注继续 bet,我硬着头皮继续 call;进入 river,按比赛细则,大白胖 dealer 把那张已经闲置一旁小一会的红桃8 随机的插进了牌堆里,开始洗牌。我坐在旁边,记得非常清楚,大白胖 dealer 一边洗牌一边念叨:我失误了,我不应该,我一定要,一定要把那张牌再揪出来。。。

话音未落,啪的一下,把那张8 发了出来,依然是那张红桃 8,一模一样!全桌选手哗然(要知道把一张牌收进牌堆重新洗牌再发出来,可只有约3%的小概率啊!)我假装一脸平静状继续 check,印度裔选手继续重注 bet,这下我不能放过他,迅速地给了个重重的 check-raise,印度裔选手明显被锤懵了,难以相信这张失而复得的红桃8 和我的手牌有什么关系,他实在不解但很快就决定 call 了;我亮出了手牌一对 8,和 board 上的红桃 8 组成了 set 8,印度裔选手很搓火,不甘心地把他的手牌也亮了出来,原来是 K/10,组成了顶两对(top two pairs),也是蛮强大的牌但小于我的 set 8。

这手牌,我赢下了巨多的筹码,给后续的战斗奠定了强大的基础。但更重要的是,这手牌这个失而复得的红桃8,在我心中树立了一个无比坚定的信念:这个比赛我赢定了(This tournamentis mine. I am the chosen one!)

比赛间隙,我找到了白大胖dealer,塞给了他40 美金的小费,他乐得美滋滋的。。。他可不知道,当时他失误把红桃8提前发出,并按规则需要重新洗牌发牌时,我可是恨不得在桌下踢他N脚!

自从红桃 8 那手牌后,我在比赛中顺风顺水,状态格外好,发挥异常出色,中间出现了一次判断失误和一位选手火拼 pre-flop all-in,也因为牌神保佑在严重落后的情况下bad-beat 对方,把对手淘汰并席卷了他的筹码。

经过 3 天每天 10 小时的鏖战,在进入决赛桌 final table 时,全场 863 名选手绝大部分被淘汰只剩下 9 名选手,我的筹码量是遥遥领先的第一,约有 1400 多万筹码,占全部筹码量的 54%;其余 8 位选手所有筹码相加只有 46%。这种领先优势,在这种顶级级别的赛事里,不能说是空前绝后,但实属罕见!

进入决赛桌的选手,都是各国顶尖高手,其中筹码量第二位的是德国籍高手Dominik Nitsche,已经在 WSOP 拿过 3 次冠军金手链可谓经验丰富,还坐在我的下手占据位置优势,这次也是一副势在必得的样子。

在决赛桌上,我一路披荆斩棘,亲自淘汰了大部分选手,一路保持明显筹码优势。

很快桌上只剩下4位选手,一手关键的牌出现了。我在大盲+1位,手牌是红桃同色4/8,拿到这手牌,我第一感觉就是倾向于 fold,毕竟4/8起手牌太弱了;但刹那间,我心动了一下,这不是那张幸运的红桃8吗?!权当是手握大牌,打吧!于是,我带头raise,德国选手在button位flat call,大盲位也 call,三位选手进入 flop;flop发出K/4/2 杂色,大盲位check,我击中了一对4率先 bet,德国选手 call,大盲位 fold;那时候,我就知道德国选手大概率击中了顶对K;我心中暗念,turn 最好发个8。。。。。。果不其然,turn 上发出了草花8,我击中了两对(two pairs)而且是非常隐蔽的两对,我设下埋伏 check 让过,德国选手果然bet,我下重注check-raise,德国选手稍稍犹豫后call;river 上发出 J,牌面上没有同花 flush 的可能,这时池子里已经有 400 多万筹码,德国选手后手约 400 万筹码,我后手筹码比他多,没有多想,我推出 all-in,德国选手很诧异,起身仔细端详桌面上的 5 张牌 K/4/2/8/J 杂色,口中开始念念有词,其中念叨的一小段我记得尤为清楚,他念叨说我的手牌不可能是4/8(那时的我,心中暗笑,一会儿让你小子好看);约2分钟后,德国选手做出决定call,我迅即亮出4/8红桃,他非常懊丧地亮出了A/K(牌力是 Top pair topkicker,虽然是很强的牌但输给我的两小对)。我赢下了这手关键牌,淘汰了最强劲的对手。

德国选手 Dominik 心情很糟糕,以至于拒绝和我握手,直接怅然离席,走到10米外观众席女友面前,当庭掩面而泣 。。。。。。

图三:2016年7月,WSOP $5k 赛事冠亚军对决,杜悦直面加拿大选手

获得第 3 名的是土耳其裔的知名女牌手 Natasha Barbour,她在短码的情况下多次preflop all-in,终于碰到我手牌 A/10 call 了她的A/5 pre-flop all-in,不出意外地将其淘汰。Natasha 获得了奖金$348,374,是其在 WSOP 历史上赢得的个人最多奖金。没有走得更远虽然有些遗憾,但 Natasha 却收获了更大的幸福。获得第 3 名后,她的男友世界著名牌手Jason Mercier 随即下跪求婚,Natasha幸福满满,当场收下戒指,说了 YES!全场顿时充满掌声和喜意,不见了战斗的硝烟。。。。。。

图四:2016年7月,WSOP夺冠后,华少代表国内媒体做专访

最终的二人对决,在我和加拿大选手 MichaelGentili 之间举行,由于双方筹码量相差悬殊,我大约有 95%的筹码量,对方只有约 5%,没有什么悬念,我很快就淘汰对方拿下了冠军。最后一手牌,记得我是 A/7 call 了对手A/2 的 pre-flop all-in,最后 community cards 5 张牌发出,双方都没有击中,我以 7 high 获胜!

德州扑克 AI

人工智能(Artificial Intelligence,简称AI)近十几年来在学术界/企业界/创投界火热得一塌糊涂。Google 下属公司 Deep Mind 的成就尤其惊人,其研创出的 Alpha 围棋 AI,在和人类围棋界顶尖高手韩国李世石 5 番棋对战中,以 4:1 的悬殊战绩取胜。

在 game 的世界里,按科班的说法,分成两类,一类叫做perfect-information game,比如国际象棋/围棋等,通俗地讲就是 game 中的双方所知道的 game 有关的信息是公开的也是完整的,双方根据相同的公开信息做出各自的判断和决策;另一类叫做 imperfectinformation game,比如德州扑克/麻将等,在这些 game里,信息是不完整的也不是完全公开的。比如在德州扑克中,各方既有公共信息(比如 board 上的 5 张 community cards)又有各自的私人信息(比如各自的 2 张手牌)。

图五:2017年4月,中国龙之队对战德州扑克AI,龙之队有两位86级校友,右三为计66的张淮

Deep Mind 的 Alpha 在围棋上大显神威,自然有其他好事者在琢磨如何把AI 用在imperfect-informationgame 比如德州扑克上。学术界里先后有加拿大的 University of Alberta 和美国CMU 大学的两帮人做出了领先的德州扑克 AI,其中尤以 CMU 大学的德州扑克 AI 为翘楚。CMU大学的德州扑克 AI,英文名叫做 Libratus,在 2017 年 4/5 月份,国内创投界的李开复和其麾下的创新工场引进Libratus,为其取中文名“冷扑大师”,在海南举办了德州扑克 AI 和中国顶尖牌手的人机巅峰对决。人机对决的另一方,便是中国龙之队(Team Dragon),由当时国内顶尖的 6 名德州扑克牌手组成,我任队长。龙之队中另有一名核心队员也是清华1986 级的校友,那就是前面提到的计算机系的张淮。

人机大战连续举行一周,结果没啥意外,自然是人类选手惨败于AI。知道为什么Libratus 这么厉害吗?Libratus采用的策略就是前文提到的 Game Theory Optimal,简称 GTO 策略。这个 GTO 策略是 CMU研究小组以博弈论中纳什均衡 Nash Equilibrium 理论为基础,用 CMU 超级计算中心的巨型算力,通过解一个超大无比的线性规划问题得到的最优策略。在这次的人机大战中,就俨然成了 Libratus“以机器之不败,战人类之可胜“的局面,结果可想而知!

正所谓,一壶浊酒喜相逢,古今多少事,都付笑谈中!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多