人工智能专家眼中的德州扑克

  • 332
  • A+

人工智能专家眼中的德州扑克


余小鲁博士(右)

余小鲁,理论物理博士,人工智能专家。在美国多年,熟悉各种西方流行的扑克游戏。从数学、逻辑学、心理学等多方面系统研究扑克游戏模型,对扑克人工智能有独到见解。


问:听说最近有为一些金融圈的朋友讲解德州扑克,他们最感兴趣的是哪方面?

答:哈哈,不能说是讲解,应该说是切磋吧,大陆民间的德州扑克高手太多了,可谓卧虎藏龙。金融圈和德州扑克有一种天然的联系,从华尔街的交易员转行去打德州扑克的有很多,从德州扑克转行去当交易员也有。最近有传言说女子德州扑克第一人Vanessa Selbst也准备进军华尔街(Vanessa Selbst,84年生,耶鲁法学院毕业,职业生涯锦标赛总奖金超过一千万美金)。

简单说,金融圈最感兴趣的就是风险。德州扑克对玩家的一个大的考验,就是要长期保持一种风险中性(risk neutral)的态度。举个例子,你面前有两种打法,一种是有20%的机会赢得五千个筹码,一种是有百分之百的机会赢得八百个筹码。大脑里面固有的风险偏好,让我们很难选择第一种打法。但恰恰在绝大多数的金融市场和德州牌桌上,要当长期的成功玩家,必须学会自然的选择第一种打法。再举个具体一点的例子,面对一个30bb的底池在河牌圈,你可以很自然的可以下注20bb做一个诈唬。但如果同样的牌同样的局面,底池有300bb,让你all in200bb做一个诈唬,很多人打了十年牌,觉得很荒唐很冒险,自己也很少尝试过,或者说尝试过一两次失败了,刻骨铭心,然后就放弃了这种打法。本质上说,就是大脑里面觉得输掉桌子上剩下的200bb筹码的痛苦程度,远远超过赢得底池300bb的快乐程度。金融市场和德州扑克都是要培养面对风险客观理性的态度。

问:冒昧的问一句,您觉得理论物理跟德州扑克有什么联系么?

答: 理论物理的思维模式,就是先承认并且透彻研究第一性原理,对其他任何假设都抱着批判的态度。德州扑克的第一性原理可以这么表述:你看不到对方的底牌,对方也看不到你的底牌。听起来很白痴,但如果能透彻认识这一点,已经是德州扑克的高手了。因为这个第一性原理的直接推论,就是你必须承认对手的持牌是一个范围(Range,德州扑克最重要的一个概念),同时承认你的持牌也是一个范围(不只是你眼睛中看到的现在持有的两张底牌)。在美国很多学生跟我这么说,对手这把牌这么打,肯定手上拿着是AK,最后翻出来也是AK,学生很高兴。但这种思维方式非常危险,因为你不知不觉中做了一个很大胆的假设,就是你能读死对手的持牌,不再是个范围。理论物理的训练,主要是让我能克服种种关于德州扑克流行的假设,或者说种种“伪理论”的迷思,这应该也是我到目前战绩还不错的一个主要原因。当然,从纯粹理论物理的观点来讲,不能排除另一个可能,就是我在牌桌上一直运气都比较好。

问:德州扑克究竟如何教?如何学?

答:如何学习德州扑克,我只有一个要求,就是纪律性,不是智商不是年龄不是任何其它因素。举个具体例子,比如我一直对学生有个硬性要求,就是永远不要讲自己被爆冷门(bad beat)的故事。但有些学生确实做不到这一点,闲聊的时候,听我讲课的时候,总会时不时说自己河牌被对手击中两个outers之类的事情。对于这些,我是零容忍的,当然每个老师都不一样。在我对德州扑克理解的体系中,任何时候都不能讲这些故事,因为这在潜意识里面对你牌技的长进有很大的负面影响。当然,要是你以后成为了非常成功的职业牌手,那时忆苦思甜,可以讲讲这些故事,关系不大,但在初学阶段,万万不可。这就是我最看重学生的一个品质,纪律性。能控制住不跟任何人讲述自己在德州扑克被爆冷门的故事,对我来说,这个学生就具备成为德州扑克高手的一切条件。

问:打扑克让你印象最深的一件事是?

答:可能每一个长期的德州扑克玩家,都各有各的“顿悟”瞬间。我自己印象最深的“顿悟”,不是在牌桌上悟到的,哈哈,而是在多年前学物理学的时候。大家可能都听说过布朗运动,就是花粉颗粒在水溶液中不停的做无规则运动。记得当年我学习布朗运动在数学上的理论,叫马尔可夫过程,简单的说,这种过程必须具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,在时间序列中与之前的历史无关。学到这里,我突然吓了一大跳,意识到德州扑克比赛就是一个马尔可夫过程,状态就是你桌子的筹码量。比如我桌子上现在有一万个筹码,是刚刚由五千个筹码翻倍赢来的,还是两万个筹码被别人一个bad beat输了一半剩下的,数学上是绝对无区别的,也就是说接下来我在这个比赛的成绩,只跟我现在有一万个筹码这个事实相关,跟我如何拥有这一万个筹码的历史无关。但对人来说,两者的区别是天上地下。人性虽然是不可以完全克服,但从这个时候起,就尽量让自己像水中的花粉,完全“无记忆”的打牌。


德州扑克







德州扑克