打了一辈子德州,居然输给了新手AI!(上篇)

  • 246
  • A+

来呀!来呀!收藏我吧!!


前段时间,受周围朋友都在玩德扑游戏的影响,喜欢上了口袋德州(德州扑克),享受和牌友心理博弈的过程,也享受“赌博”带来的快感。一直觉得德州最大的魅力就在于它不完全是理性的判断,更多的是感性、勇气和理智之间的较量,不确定性太多,所以它区别于其他的棋牌类游戏,没有办法通过学习一些套路和技巧就能完胜对手。

最近回了学校,又开启了每天和AI“博弈”的磕盐生活。今天惊奇的发现,AI打德州扑克居然也完胜人类了!此次比赛共持续 20 天,由 4 名人类职业玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 对战人工智能程序 Libratus,在为期 20 天的赛程里面对玩 12 万手,争夺 20 万美元的奖金。最终的结果是「比赛过程中,人类选手整体上从未领先过」

随着天数的增加,AI和人类选手的差距愈发明显

  近几年,随着科技的不断发展,计算机打败人类的案例屡见不鲜。作为一只“程序媛”,我也算是半个“局内人”,本科参与过一些计算机博弈和机器人相关的比赛,硕士期间对AI也有一些浅显的了解。 

    今天就从理性的角度讲讲,AI是如何打败人类的。

几年前也是辉煌过的~~~


1


德州扑克怎么玩?(会玩请忽略)

德州扑克是目前世界上最流行的扑克游戏,


  总结来说,如果想要赢牌,第一种可能就是你的牌比其他人的牌都大第二种可能就是通过押注的技巧把牌没有你大的对手都吓跑。可能性就是口袋德州最有趣的地方。




2

完美信息博弈和不完美信息博弈

  为什么AI不容易在德州扑克上打败人类呢?德扑游戏和围棋对AI来讲到底有什么区别?

     首先,要理解完美信息博弈(棋牌类游戏)和不完美信息博弈(扑克类游戏)的区别。

  完美信息博弈是指后行动的参与者可以观测到先行动的参与者的行动信息。棋牌类游戏,双方的信息都是共享的,比如围棋,双方都能够看到场上已经下过的旗子以及双方的优势和劣势。

     而扑克、谈判、商业决策等问题,双方的信息都是不公开给对方的,也即是说但参与者做选择的时候不知道其他参与者的选择,这就被称谓不完美信息博弈简单来说,如果把其他参与者的行动理解为一个参与者做决策时所面对的环境,信息不完美就是决策者不知道自己所处的决策环境。对德州游戏规则,即使对手all in了所有的筹码,那么我们也不清楚他手里到底有什么底牌,信息的不对称,就迫使大家必须有“赌一把”的精神。这也是为什么金融人士和投资大佬们都喜欢玩口袋德州。


3我们用理工的思维讲讲AI是怎么赢了人类的


打了一辈子,居然输给了新手AI!(中篇):https://www.moshike.com/a/353.html 


德州扑克
德州扑克