EV怎么提高

  • 130
  • A+
EV怎么提高




上周在RIO上看到Ribeiro和他的朋友一个很有意思的争论。Ribeiro在NL$500级别6人常规桌打了一手牌。

20220127145758

他回头复盘,通过PioSolver去检验自己在转牌继续下注的决策是否正确。PioSolver的计算结果显示这是100%的过牌,但是做小尺度下注和过牌的EV差距非常的小,只有$3.3/100手牌的区别。

20220127151100

这时Ribeiro和他的一个朋友发生了一个争论:
  • Ribeiro的朋友认为如果他持续用K♠T♠高频下注,这里下注的EV是会改变的
  • Ribeiro认为对手没有能力去识别出这种微小的偏离来针对他,所以他的下注EV不会改变

这个讨论让我有很多思考。我认为这个争论的背后涉及到了一个非常重要的问题,那就是PioSolver是如何根据我们的行动来计算EV的,或者说:

EV是如何通过我们的行动产生的?

EV是扑克中我们做决策的核心标准。但我们通常只是简单的去了解了EV的计算公式,但并没有非常深入的去理解EV和双方策略之间的互动关系。

所以今天我们就通过这个几个案例来详细聊一下EV是怎样炼成的。

若不想看数学部分,也可以直接看加粗蓝字部分的结论。





经典模型:河牌极化下注 vs. 抓诈手牌


为了来深入理解EV,我们首先建立一个简化的模型。
  • 河牌圈,牌面22♠2♣23
  • OOP手牌范围里只有AA和55
  • IP手牌范围里只有TT,99和88
  • 底池100,双方有效后手100
  • 双方如果要下注,都只有全下100一种尺度

根据GTO的原理,OOP方会100%的下注自己6个组合的AA来获取价值,同时下注50%的55来平衡自己的下注范围,使得IP抓诈与否EV无差别。

20220127151504
20220127151634

而IP则还会选择最低防守频率,用自己手牌范围中的50%去抓诈,使得对手诈唬与否EV无差别。

20220127151901
20220127152053

那么问题来了,PioSolver是如何计算出每个动作的EV的呢?

我们知道,下注之后,我们可能得到三种结果:对手跟注我们获胜,对手跟注对手获胜,对手弃牌。


EV(下注)
= EV (对手跟注我们获胜)- EV(对手跟注对手获胜)+ EV(对手弃牌)
= 跟注频率 × 底池权益 × (底池+下注尺度)- 跟注频率 × (1-底池权益)+ 弃牌率 × 底池

所以55诈唬下注的EV为

EV(诈唬55)
= 0.5 × 0 × (100+100)-0.5 × (1-0)×100+0.5 × 100
=0-50+50
=0

而AA价值下注的EV为

EV(下注AA)
= 0.5 × 1 × (100+100)-0.5 × (1-1)× 100+0.5 × 100
=100-0+50
=150

我们一个动作的EV是我们可能得到的每一种结果的总和。Solver的工作原理就是计算每个动作后可能得到的所有结果加总,然后呈现给我们。


回到Ribeiro的手牌


通过刚才的讨论,我们可以知道Solver通过计算小额下注K♠T♠这手牌所有可能得到的结果,之后加总,得到了下额下注K♠T♠这手牌的EV为154.2/100手。

来解决之前两个人的争论,我们来通过solver实验两个情境



情境一:


我们让OOP的选手100%的下注K♠T♠这手牌,同时我们假设IP对手能够发现他的这个偏离,并允许IP的对手做出针对性的调整。

Solver计算结果显示,在被针对后,小额下注K♠T♠的EV急剧下跌到-136.6/100手。

20220127152509

这里EV急剧下跌的原因是由于我们在转牌过度诈唬,对手针对性的采取了过度跟注的策略,把跟注频率从76.08%提高到了82.65%。



情境二:


我们仍然让OOP选手100%下注K♠T♠,但我们假设IP对手不能够发现这个偏离,所以仍然采用之前的策略。

Solver计算结果显示,由于对手的反应没有改变,我们EV也没有改变(下图中0.2的差距是由于无法100%锁定策略的技术原因导致的,不影响我们的结论)

20220127152651

所以我们可以得出结论:

  • 如果对手不能发现我们的偏离做出针对性的调整,那么无论我们用一手牌做出一个动作的频率如何,这个动作的EV都是一样的。

  • 如果对手有能力调整他的策略,那么后续的动作和相关的变量就会发生变化,那么我们的动作的EV就会发生变化。


Ribeiro 1:0 他的朋友。

我们还可以进一步的对这个结论进行推论,GTO之所以是一个目前主流打法,优势在于其频率和范围的平衡,不会被对手针对。而如果你的对手没有能力对你做出针对,那么你就可以简单的选择当前EV最高的选项去攻击对手,而不需要考虑频率和平衡。


经典模型:转牌OOP抓诈



我们再建立一个模型来看一下我们前面得到的一些结论如何帮助我们在实战中做出更好的决策。
  • 转牌圈,牌面3♠33♣2♠
  • OOP方只有KK
  • IP方只有AA,52o和42o
  • 底池100,双方有效筹码400
  • OOP过牌,IP可以选择下注100或者过牌
  • 如果OOP过牌跟注,河牌圈OOP过牌,IP可以选择下注300或者过牌

OOP过牌后,IP的GTO策略是100%下注AA来获取价值,诈唬38.2%的52o和42o来平衡下注范围。

20220127152942
20220127153135

而OOP会跟注自己50%的KK,他的跟注EV为0。(由于Solver没法跑到100%的精确度,所以solver显示的EV只能非常接近为0)

20220127153426
20220127153718

同样的,这里转牌KK跟注的EV也是河牌三种可能性的EV之和。

EV(转牌KK跟注)= 0
= EV (河牌过牌弃牌)+EV(河牌过牌跟注)+EV(河牌过牌对手过牌)

20220127153843


我们通过计算可以看到,对手河牌下注时会平衡自己的价值诈唬比例使得我们抓诈与否无差别。我们的利润主要来源是河牌对手放弃诈唬的EV来弥补过牌跟注和过牌弃牌的EV损失

在了解了GTO的策略后,我们再来看如果对手在转牌过少诈唬或者过度诈唬会发生什么。

当我们把IP诈唬52o和42o的频率从38.2%降低到28.3%,OOP方开始过度弃牌,盖掉了自己所有的KK。因为此时跟注已经负EV,弃牌0EV成为了EV最高的选择。

20220127154001
20220127154047

通过计算我们可以看到,由于对手在转牌过少的诈唬,所以对手河牌的下注频率提高,导致了我们在过牌-过牌这条线上的EV降低,无法弥补过牌跟注和过牌弃牌的损失了。

20220127154220


而如果对手在转牌过多诈唬,把诈唬52o和42o的频率从38.2%提高到48.2%,我们就应该过度跟注所有的KK,因为此时跟注已经是最高EV的选择了。

通过计算我们可以看到,由于IP转牌诈唬组合过多,导致自己河牌上不得不放弃大量的诈唬,有更大的可能过牌,使得我们过牌-过牌这条线上EV提高,弥补了过牌跟注和过牌弃牌的损失之后仍有盈利。

20220127154310


通过这一系列的实验我们可知,当我们在转牌持有抓诈手牌,要决定是否跟注时,主要的判断依据就是对手转牌诈唬的频率,以及河牌继续诈唬的频率。如果对手转牌诈唬偏少,那么我们的跟注就很可能负EV,而如果对手转牌诈唬偏多,且河牌会放弃很多诈唬,那么跟注就变得更加正EV。


总结



EV作为我们打牌的核心依据,由于在翻前以及翻牌转牌圈上都有着非常大的不确定性,使得很多时候我们没有投入足够的精力去思考和研究。

但我们可以发现,我们的每个动作的EV来源于后续所有可能的加总,那么我们就可以去思考哪一种可能性是我们EV的主要来源,如何进行针对来提高这种可能性发生的频率从而提高我们每个动作的总体EV。

同时我们也要对对手的行动进行观察和思考,来判断对手面对我们的打法是否有针对性的调整。这也是中低额牌局中我们更多的去考虑针对,而在高级别牌局中更多的在意平衡的根本原因。



德州扑克







德州扑克