最优扑克策略GTO在德州扑克实战中是怎么执行的?

  • A+



网友问:想问一下有没有人能解释一下德州扑克中的GTO策略具体是怎么执行的?


李思晓答:


谢邀,这段时间一直在忙比赛,才看到这么多邀请的问题,我会尽自己能力给大家一些讨论。


GTO的实战意义在于:


  1. GTO是衡量一个玩家在不知道对手信息时,玩法正确与否的标杆。

  2. 使用GTO策略可以有效的防止自己损失EV。

  3. 如果对手不使用GTO策略,意味着对手出现漏洞,从而给我们剥削的可能。


然而,人类玩家是永远不可能做到完美的执行GTO策略,这是因为:


  1. GTO策略树极端的复杂,人脑无法遍历这么复杂的策略树。

  2. 人脑无法很好的在混合策略时随机自己的频率,从而达到完美的平衡。


人更多是用固定的尺度来化简实际的GTO策略,使自己能够更容易的记忆这些策略。与此同时,减少自己的EV损失。通常,我们会有 25%,33%,50%,100%,200%等下注尺度,然后带入到软件计算,通过软件模拟出一个接近的频率,并对这个频率进行记忆。在遇到相似的情形是,我们就执行软件跑出来的结果。这就是作为人类玩家如何模仿执行GTO策略了。


网友问:GTO在德州扑克实战中是不是玄学?


李思晓答:


首先,国内玩家对GTO的理解和描述经常是有误会的。


这里我抛一个定义:当对手单方面无法通过调整他的策略来提高对我们的EV时,我们此时的策略是GTO的。


举个大家容易理解的例子:


比如说我们常见的石头剪刀布,如果我们的策略真的是随机的1/3,1/3,1/3时。对手怎么样调整自己的猜拳频率,都不可能提升对我们的胜率。这时候我们就是GTO的。


但是,当前通过计算机我们看到的GTO策略是极度混合复杂的,人脑再强也无法完全做到,毕竟人脑无法遍历所有的范围,也不能随机掉自己的频率。


但GTO在扑克实战中并不是玄学,而是具有重大意义的。


我举两个场景来说明:


第一个是当我们新坐下一桌的时候,面对一桌陌生的玩家,我们没有任何对手的历史信息的情况下。我们将努力的模仿GTO策略,来尽可能的少被剥削。我们需要一定的对手的手数来获取其他玩家的信息,包括玩家的类型和手牌范围的上下限。进而我们才能采取基于GTO的剥削策略获取更大的价值。


第二,我们怎么知道玩家漏洞究竟是什么样的?抛去old school定性式的描述,有没有精确的方法来衡量?举个例子:



在这样一个面,我们发现对手的cbet频率明显高于50%,比如高达75%以上,就意味着他咋呼的过多了,我们用更多的牌去加注他,他就难以抵抗。这个例子是为了说明,GTO策略的研究,为剥削打法设立了一个标准,任何偏离GTO标准的频率,在实战中如果被发现,都可以针对性的调整进行剥削。


而在国外,使用piosolver来寻找并构建GTO策略和range已经是非常普遍现象了。但在中国有能力的玩家依然比较稀有。


德州扑克
德州扑克