GTO策略在牌桌实战中的应用

  • 1354
  • A+
GTO策略在牌桌实战中的应用



如需系统学习GTO,请点击查看德州扑克GTO视频课程:https://www.moshike.com/a/4232.html 


这周在给一个基础水平比较好的朋友讲初段GTO的私教课程。讲完高张牌面c-bet的案例的时候,这位朋友非常认真的去翻阅了很多以往学习的《现代扑克理论》,去比较我所讲授的策略与书中策略的异同,然后和我探讨这些差异的原因。

我非常欣赏这位朋友的钻研精神和独立思考能力。其实这里他本质上是提出了几个非常值得我们去探讨的问题:

  1. GTO在实战当中的作用是什么?

  2. 我们是否在实战当中应当把标准GTO作为默认策略?

  3. 如果不是,那么我们的策略设计的思路是什么?

所以本周这篇文章我会分享我对这些问题的观点。对于GTO是什么还不太熟悉的朋友,欢迎阅读往期文章!


5336397c6b5df5818d9d22a3d6f797ee.


GTO在实战当中的作用



关于GTO在实战当中的应用已经有过很多很多的讨论,各路大神轮番交手,吵得不亦乐乎。本人才疏学浅,不敢和大牛们掰手腕。我自己学习GTO很多年,也有不少的GTO教学经验,在这里只是简单的分享一些思考,大家姑且一听。

标准GTO是不能直接的应用于实战的。这是由GTO本身两个方面的特点决定的。

  1. 标准GTO的使用者是电脑AI,而不是人。

  2. 标准GTO假设对手也使用标准GTO,也就是说对手也是电脑AI,而不是人。


20220124113307

第一个特点很好解释。上面这张图是一个Solver求解出的标准GTO解决方案。这个解决方案要求我们准确的把所有的手牌按照准确的比例分布到四个不同的动作当中。这样的一个解决方案人类是不太可能自己在牌桌上推导出来,也不太可能通过记忆来复现的。

而这只是某一个位置,某一个牌面,某一条街,某一方的解决方案。如果想要在实战当中面对任何一种情况都能使用标准的GTO,那就只有电脑AI可以做的到了。

所以我们在通过Solver进行GTO学习的时候,目的不在于记住标准的GTO是如何打的,而是在于弄明白GTO为什么这么打,理解背后的原因,然后把这种思考方式带入到实战当中来。


第二个特点相对于第一个特点则更加的重要。GTO在理论里的对手都是电脑AI,而AI最大的特点就是只有运算没有人性。实战当中,你的每一个对手都是一个活生生的人,每个人就都有他自己的性格和脾气,有他自己当天当时的状态。这些特点来到牌桌上时,呈现出来的就是五花八门的牌桌策略和随机性的决策方式。

比如下注时的价值和诈唬比例,GTO要求我们在下注时价值和诈唬严格按照我们的下注尺度给对手的底池赔率来分布,从而使得对手抓诈与否没有区别,对手无法针对性剥削我们。我们下注1/2底池,给对手的赔率是1赔3,那我们就应该每3个价值组合配1个诈唬组合。

但在实战当中,我们几乎见不到任何一个对手是拥有完美抓诈频率的。对手要么抓诈过多,要么跟注过少。当我们发现了对手的特点后,我们就应当针对性的调整,偏离GTO,增加或者减少价值比例,来剥削对手的漏洞。


有很多人说如果你遇到一个你完全不了解的对手,那就应该严格执行GTO策略。但其实也不尽然。我们虽然不了解一个特定的对手,但我们了解整体人群的普遍特征。当我们来到一个娱乐性的线下朋友局,我们可能不认识每一个对手,但我们的经验是这种局的玩家普遍大底池诈唬偏低,跟注偏多。所以我们刚开始就应该偏离GTO,打更多实牌,面对大的下注可以适当过度弃牌,然后再来观察每个对手的特点来进一步调整和剥削。

所以综上所述,实战当中,针对性剥削一定是优先于GTO的平衡和频率要求的那么回到我们最初的问题,针对性剥削那么重要,那么学习GTO是为了什么?

简单的来说,所有的针对性调整都要有一个调整的基础,有一根准绳,GTO就是这根准绳回到前面的例子,我们要判断对手抓诈偏多还是偏少,首先要知道不偏是什么样子。这个不偏的状态就是GTO中的最低防守频率。我们观察对手抓诈的频率相对于GTO最低防守频率偏多还是偏少,以及具体偏离的程度,才能形成我们对对手漏洞的判断。

知道了对手的漏洞,我们就知道了调整的方向。我们发现对手抓诈偏少,那我们就应该增加诈唬。但我们在什么基础上增加诈唬呢,原本的诈唬频率应该是多少呢?那么我们就又回到了GTO本身来,根据GTO的频率计算来知道原始的诈唬比例,然后在这个比例上根据对手的偏离程度来增加我们的诈唬频率,来最大化我们的EV。


所有由此我们可知,GTO就是我们对于牌桌上一切问题求解的核心。我们通过建立完整GTO思维框架来解读和思考牌桌上出现的局面,得出准绳,然后根据对手的漏洞调整偏离方向和程度,做出正确的决策。

GTO的出现,客观上使得每一个娱乐牌手都有机会一探德扑本质的奥秘。相对于其他投资游戏神秘又模糊的各种所谓心法和策略,GTO交给了每个牌手求解的钥匙,使得这些年德扑玩家的整体水平飞速提高。所以说搭建好GTO思维框架可以说是每个想要深度参与这个游戏的玩家的必经之路。


整体策略的设计思路



我们了解完了GTO在实战当中的作用和地位,同时也了解了完全遵循GTO标准打法和策略的难度。那么接下来的问题就是,我们是否应该把GTO标准打法作为我们的默认策略准绳,尽力的去在每个决策点去建立这个准绳,然后以此为基础进行调整。

要回答这个问题,我们首先要理解solver对于GTO的策略的设计思路。目前市面上主流的solver都采用CFR算法,简单点说,就是让电脑双方不断的根据对手的漏洞进行针对性的调整,直到双方都找不出对方可以利用的漏洞为止,这时得到的打法就是GTO的标准打法。

这种算法的使用核心的理念有两个:

1. 通过频率和范围的平衡使得对手即使100%了解我们的策略也无法做出针对性的剥削。
2. 在1的基础上最大化手牌范围的整体EV。


除了这两者以外,Solver不会去考虑其他的问题,比如求解出来的打法是否方便记忆,是否易于理解使用,实战双方是否能够100%了解对方的策略等等,都不是solver的关注点。于是这就出现了前文中的标准GTO在实战应用里的第一个障碍:这玩意儿不是人能模仿的。

但我们是人,那就需要对GTO进行适当的简化。我们首先要去理解GTO标准策略中Solver之所以进行相应操作的原因,然后基于这些理解,在保持平衡性和整体EV差距不大的情况下,把策略简化到自己的水平能够使用的水平。

所以我们自身在实战中使用的默认策略应该是有适当简化的GTO策略。

  1. 对平衡性和手牌范围整体EV的损失不大

  2. 在1的基础上把策略使用和后续决策难度降低到符合自身能力的水平。


我可以举两个我在教学中的例子来详细说说这种简化。以翻前为例,我有一个学生,刚开始来上私教课的时候基础相对比较薄弱,一般第一堂课我都会和学生一起根据他们的水平开始设计一套适合他们的默认的开池加注范围。

20220124113450

在有straddle和ante的线上8人局,GTO标准开池加注范围达到了18%,且为了照顾到牌面的覆盖性,很多的手牌是根据一定频率来进行开池加注的。

我们知道,玩儿范围越宽,翻后决策难度越高。尤其是对于前位来说,在不利位置玩的手牌超出了自己翻后技术能够控制的范围,会直接导致大量的EV损失。同时按照一定频率来进行开池加注也从记忆力和操作性上对牌手提出了更高的要求。

所以根据这位学员的特点,我把他在枪口的开池加注范围进行的很大的削减。可玩性较低的不同色部分压缩到了极致,在可玩性高的同色牌范围上也进行了一定的筛选。

这种简化在一定程度上牺牲了一些EV和牌面覆盖率,但是翻后决策难度大幅降低,记忆难度和可操作性有了大幅度的改善,对于这位学院来说,这套范围使用起来的EV一定比标准GTO范围的EV要高出不少。

再谈一个翻后的例子。我在文章开始说的学员跟我上初段GTO的私教课,他向我提出的问题就是在AQ4彩虹面,庄位对大盲的案例中,我给他讲解的c-bet策略c-bet频率只有26%,而他根据书本知识和自己经验认为这里GTO的c-bet频率应该高出很多。

为了回答他的问题,我用Solver给他模拟了两种c-bet方案,一种是GTO标准方案,一种是我讲解的GTO初段的c-bet方案,两者进行了一些比较。

20220124113653
20220124113926

首先我们可以看到我的学员的理解是正确的,GTO标准的c-bet频率确实高出很多,达到了82.68%,离全范围c-bet也相差不远了。而我给出的c-bet范围则只有25.6%的c-bet。这个差异的产生就来源于我对初段GTO学员的技能水平进行的相应的简化。

对于刚开始接触GTO的朋友们来说,讲解100多个类别的翻牌面是不现实的。这个阶段的牌手往往对于手牌范围与牌面的互动关系还不熟悉,对于GTO策略的基本原则和思考方式还没有掌握。非常细致的深入挖掘标准的GTO方案无异于进入层层迷雾,既记不住,又理解不了,更谈不上实际应用了。

所以刚刚入门GTO的朋友们要学习的策略必须进行高度的归纳和简化。为了保护我的私教学员的权益,在这里我不能详细讲解这个c-bet策略具体的原则和方法。但是这种简化首先把大量的按照一定频率去进行不同操作的情况减到最低,同时也很大程度上降低了后续街上的决策难度。

GTO标准策略之所以有这么高的c-bet频率,在于通过在翻牌面上的高频率的c-bet,利用对手没有位置,手牌范围又很劣势的困境,来最大化的移除对手的底池权益。但问题在于,当对手过牌跟注后,我们的手牌范围仍然与翻前接近,保持了一个很宽的范围,但对手却弃掉了很大一部分垃圾手牌,使得跟注的部分与牌面都有一定的关联。

这个问题导致的结果就是GTO标准策略需要在转牌以65%的频率高频过牌,从而避免用一个较弱的范围进一步造大底池。这就导致c-bet频率和转牌的第二枪的频率出现了一个很大的距离,很大程度上降低了大盲在flop上跟注的压力。

20220124114404

于此同时,我们转牌过牌的范围会被cap。Solver处理一个capped手牌范围毫无压力,但对于一个GTO新手来说,一个capped手牌范围是非常难以操作的,通常要么严重过度弃牌,要么会过度跟注。所以减少这种情况就能很大程度上降低我们的操作难度。

最后回到EV和平衡的角度,在11的底池中,GTO标准c-bet策略全范围EV为7.13,而简化后的策略全范围EV为6.89,仅低了4%。而这种策略可操作,易理解,平衡性好,后续决策难度更低,对于GTO新手来说,一定是更加赚EV的策略。


总结



GTO策略自诞生之日起就成为了扑克领域策略的主流,一定是有原因的。虽然不能直接100%复制用于实战,但是GTO一直是实战的指导方向和针对性调整的准绳。

学习GTO的过程是复杂和漫长的,这个过程中我们要时刻根据自己的学习的进度和能力不断的进化自己的策略,使得你的策略与自己的水平和能力相匹配,不断的提高整体手牌范围的EV,减低后续决策的难度。


德州扑克







德州扑克