德州扑克的思维层级与博弈

  • 1110
  • A+

德州扑克的思维层级与博弈



这期主要是讲扑克博弈理论中的思维层级与博弈。博弈理论是由计算机之父冯·诺依曼开创的,扑克很适合我们这期的博弈理论的主题,因为冯·诺依曼开创这项理论的根源就是他为研究扑克而出的一本数学著作。



赤壁之战,曹操败走,诸葛亮布阵的时候安排关羽说:“云长可于华容小路高山之处,堆积柴草,放起一把火烟,引曹操来”。关羽说:“曹操望见烟,知定有埋伏,如何肯来”。诸葛亮笑曰:“岂不闻兵法‘虚虚实实’之论?曹操虽能用兵,只此计可以瞒过他也。他见烟起,将谓虚张声势,必然投这条路来。将军休得容情”。后来曹操在撤军途中遇到赵云和张飞两员大将截击,死伤惨重,来到华容道路口之后,发现有两条路,军士报曰:“小路山边有数处烟起;大路并无动静”。曹操曰:“岂不闻兵书有云:虚则实之,实则虚之。诸葛亮多谋,故使人于山僻烧烟,使我军不敢从这条山路走,他却伏兵于大路等着。吾料已定,偏不教中他计”,于是让军士走有烟雾的那条道。最后就有了关云长义释曹操。

——《三国演义》


这个故事讲述的就是两人的思维层级的不同。在两条路上如果瞎选一条路撤退就是负层思维;如果是按一般常识来选择一条路,比如看到有烟雾考虑到这是代表有人驻守,选择没有烟雾那条路的就是0层思维,关羽思考战术就是0层思维;如果站在防守者角度,考虑到有人驻守的话,肯定会让军士不要生烟雾做饭,免得暴露自己所在,那么生烟雾的话肯定是疑兵,守军必防守于没有烟雾那条路,于是故意走有烟雾那条路就是1层思维,曹操思考战术就是1层思维;如果在考虑到对面军师拥有1层思维,哪里有烟雾就走哪里,于是故意让守军生烟雾这就是2层思维,诸葛亮的战术是2层思维。结果很明显,诸葛亮在2层思维上击败了曹操的1层思维。

有趣的是,如果曹操的策略不变的话,让一个完全没有经验的军师布阵,也许不小心军队生了烟雾,而曹操错误理解了这个信号的意义,也照样会落入圈套。所以并不是思维层级越高越好,也许思维层级太高会聪明聪明反被聪明误,最好的是思维层级比对手的思维层级高一等级。


e228d71d44bd004d79cd831dc5e795d8.

以前我通过卫星赛打进过某个德扑平台举办的世界明星挑战赛,每次比赛会专门请来一些世界顶级选手坐庄和普通玩家来打牌。这次游戏我和网上昵称叫做Isildur1 的Victor Blom对战,他是和Tom Dwan齐名的世界最著名的疯狂松凶玩家



比赛中有一手关键牌,我在转牌击中了同花,对手下注,我反加注,结果对手再反加注,我们打到 All—in 以后才发现他是空气牌;还有一手牌他 A7 翻牌前加注,我 A10 反加注,结果他翻牌前推我all in,我 AT 接了他的 A7。


这两手牌的最后我都是赢了。如果是在普通的线下浪局里面,肯定有人会说这位玩家看起来是条凶鱼,而Victor Blom是世界最出名的扑克选手之一,很多世界明星都是他的手下败将。为什么我能侥幸赢下这两局呢。事后分析原因应该是:平时和他比赛的玩家都是顶级高手,这种级别的玩家思维层级比较高,选手并不一定需要拿到什么牌才能够操作,所以诈唬很频繁。他没跟我游戏过,他误以为我是和他平时玩的游戏一样层级的玩家。而我玩的层级平时遇到的对手并没有那么多诈唬,一般是有牌就打偶尔诈唬,并且我事先已经知道对手很可能是疯狂打法,所以稍微占了点优势。(当然运气好也很重要)

所以思维层级并不是越高越好的,一些人在某手牌诈唬别人的时候往往考虑:我这手牌应该可以扮演这个或那个角色,或者考虑对手看到这么危险的牌面弃牌率已经很低了,这样的牌面我还敢去偷鸡对手,肯定会以为我确实是有牌,于是就去诈唬了。结果对手根本没有考虑到那么多直接就秒call了,最后往往演变成送钱了。这就是犯了思维层级太高的错误。真正要达到双方都很高的思维层级的高水平桌子才会出现Phil Ivey和Paul Jackson那手经典牌局——两人都用空气牌加注,反加注,最后Ivey用 6-Bet 把对手打飞。


 


有时候思维层级过低,会造成你认为对手有牌就打,没牌就fold,结果对手经常会诈唬你。然后你做了调整认为对手是诈唬的时候,结果却是对手却拿的是坚果牌,让你损失惨重。所以打扑克很重要的一点是观察对手在什么思维层级,确定对手是真有牌还是在诈唬,利用已知的信息来调整策略。但是要把握准对手的层级其实并不容易。真要摸准一个人可能要观察很长时间,而有很多桌上对手也许你一辈子就和他打一次。最致命的是有时候一手牌可能会完全误导了一个人的判断。

比如前文提到的我打的那场比赛,我之前有一手牌犯了个错误在河牌做了一个很没有道理的3bet诈唬被他抓了,也许他以为我是特别喜欢诈唬的选手,所以对他之后的决策也有了一定影响。如果你知道对手的手牌历史和风格自然很有利,也许这个信息在短期内甚至是压倒性的。有时候你也可以在成本不高的情况下故意卖个假破绽(比如线下有些人喜欢一上场就拿垃圾牌作3-Bet一手偷盲然后亮出这手牌让人以为他是松凶鱼),期望对手在未来的牌局中以为你瞎打而输给你一大堆筹码。当然,这也有可能你这个假破绽成本太大未来收不回你的成本也有可能,或者对手根本没想太多。

从1到100要选择一个数是所有人所选的平均数的2/3才是正确答案。这样的话就需要思考对手一般会选什么样的数字了。从什么思路着手呢?

思路讲解


1、假设所有玩家都选择100这个最大数,那么正确答案是100X2/3≈67。也就是所如果答题在67以上的玩家,很可惜你甚至不能够称为0思维层级,应该算作负层级思维了。这次回答中还是有一些玩家选择这范围的答案的。当然了这个小游戏可能很多人懒得动脑子,所以也可以理解。

2、假设你认为所有玩家都是随机行动而没有任何思考的话,那么他们的选项应该是1-100任意一个数,他们选择的数字的平均数应该是50,而50的2/3就是33了。选择这个范围附近的玩家应该属于0层级思维。我们上期正确答案是37.8因为大家所选的数字的平均数是56.7。也就是说大体上所有玩家都是随机选择了一个数字。如果你能猜到你的对手是用了随机选择的方法,你的答案应该会接近这个正确答案。

3、假设你认为所有玩家都是会玩这个游戏的,应该会想到其他对手自己起码不会认为别的玩家都是瞎玩的,但是你认为他们没有推理能力,只能按照一个类似电脑游戏里的NPC人物那样考虑到什么是不可能的,简单地做一个不至于明显犯错的行动。那么你会考虑到对手可能会选择33,那么你就应该选择22。这是第1层级思维。

4、假设你认为所有玩家都会玩这个游戏,并且他们也是有一定思维的,他们会认为对手会知道别的对手不可能瞎玩,但是你认为其他对手他们自己会觉得他们的对手并没有推理能力而只会选择33,那他们自己就会选择22,这时候你就应该选择14。这是第2层思维。

5、以此类推,第三层思维是10,第四层是7。

6、如果大家都玩得很高端,肯定到最后就变成了所有人都选1的结局。有不少读者选择的是这个答案,我可以说这些玩家肯定是这个玩法的推演的,但是这些玩家思考是太高端了,这种层级如果换成扑克的话应该是远高于世界上最高等级的扑克桌了,我觉得也许以后哪天人工智能统治了扑克桌的话,他们打扑克应该是这样的层级吧。



其实现实中的很多博弈游戏中,往往第1层级和第2层级的思维就能战胜大多数玩家了,甚至因为有负层级玩家存在,只要按照0层级游戏就能够盈利。所以在鱼多的局中打诚实扑克就已经能够盈利了,也许你仔细算算在这样的桌子上诈唬输掉的筹码比赚回来的筹码更多也不一定。或者在有一些水平的桌子,你知道对手会玩扑克了,你稍微能考虑一下对手的处境,在对手这样玩的情况下他是代表了什么。对于更好一些的对手你能考虑到对手也会考虑到你在思考他的行为,以此做调整。

但是上面说的很简单,博弈理论只能做一个理论基础。人还是很复杂的,你很难判断对手在哪个层面(比如我这次玩这题就错得很离谱);即使猜到了,人有时候会因情绪等原因突然偏离你的预想,让你判断失误;即使是一些高手在某个级别打惯了,来到别的级别游戏也可能会一时很难调整之前打法,犯一些很奇怪的错误,也许这些打法在他经常玩的级别是完全合理的,只不过他在现在的级别不合时宜了。打个比方吧,如果直接运用Tom Dwan的高额打法在金牌德州的宗师场玩,而不做出对应策略调整的话,短期内也不一定能做到盈利。


德州扑克







德州扑克