德州扑克机器人

  • A+

德州扑克机器人


如需德州扑克机器人软件,请查看:

https://www.moshike.com/a/4344.html 


人工智能研究最近取得的突破,引发了关于机器人是否会给网络德州扑克平台构成威胁的质疑。


全球4名顶尖职业扑克玩家历经20天的鏖战,还是在美国匹兹堡的大河娱乐场(Rivers Casino)以失败收场,可见德州扑克机器人已经发展得非常强大了!


德州扑克机器人


比赛期间,他们会在上午11点前出现,身着运动裤和时尚的运动鞋,在电脑屏幕前坐下来。

在夜晚返回酒店之前,他们每天都需要玩1500手无限制德州扑克。这经常意味着他们需要打牌至晚上10点以后。

在一整天的时间里,星巴克咖啡和矿泉水就放在这几位牌手的键盘旁边,脚下则放着快餐袋。


德州扑克机器人


 1979 年,人类首次在西洋双陆棋游戏(backgammon)中败给机器。1997 年,Gary Kasparov 输给 IBM 的深蓝。当时他评论说,可以感觉到对手是种新的智能形式。人类输给机器的其他游戏包括:西洋棋、黑白棋、拼字游戏(Scrabble),甚至是 Jeopardy! 和经典的 Pong。


 最近,人工智能打败顶尖围棋高手。2016 年 3 月,李世石 4:1 惜败 AlphaGo。2016 年圣诞节期间,匿名再度出山的 AlphaGO 陆续击败中国顶尖围棋高手,赢得毫无悬念。


虽然 Libratus 赢得过程的细节仍然是个秘密。但是我们能在卡耐基梅陇大学之前的研究基础上,凭经验猜出个八九不离十。最有趣的或许是这次的胜利依靠更多的是 Good Old Fashioned AI(GOFAI)而不是当前时髦的深度学习过程。就像象棋比赛中的深蓝一样,Liberatus 用了很多蛮力计算来发挥到最佳水平。我们知道它动用了匹兹堡的超级计算中心来完成每一场比赛。


德州扑克机器人

由于在德州扑克中,玩家们无法获取已发生事件的全部信息,诸如对手的底牌,因此这个游戏属于“不完美信息”(Imperfect Information)类游戏。虽然德州扑克的缺失信息比西洋跳棋少,但是这种不完美信息的特质使得双人德州扑克成为难度远远更高的人工智能挑战项目。研究者表示,要破解这样的游戏,势必需要更大的计算机记忆和计算能力。

  然而更重要的是算法。鲍林和同事开发了一个叫CFR+的算法,这种算法是CFR算法(counterfactual regret minimization,虚拟遗憾最小化)的一个变体,从使遗憾最小化的角度学习最优的博弈策略。鲍林表示:“我们工作的主要突破是基础算法的改良。这意味着,在任意形式的大规模模型里,基于博弈论的推理将变得更加容易。”

德州扑克机器人

  这个算法的表现怎么样?鲍林解释说:“想象一下一个人每小时玩200局扑克,每天玩12小时,70年从未有一天间断。进一步假设他时刻考虑最差的情形,争取最大程度的胜利,采取针对性的策略,并永远不出现一次失误。”他们的程序每秒进行24万亿局,连续操作两个月,结果提示他们基本破解了这个游戏。现在,网友们可以在阿尔伯塔大学的网页上与这个叫Cepheus(仙王座)的程序交手。

  虽然听起来很好玩,博弈论其实一直被寄望于处理一些严肃的问题——在安全领域,博弈论的应用已掀起热潮,例如机场检查点的设置、飞机起落的次序和警卫的巡逻中都有博弈论的身影。在真实世界中,我们往往需要在信息不足或不确定时做出决定,有了更好的博弈论算法,我们才能更好地解决未来的实际问题,正如鲍林试图解决德州扑克问题一样。


德州扑克







德州扑克