德州扑克AI机器人

  • A+

德州扑克AI机器人


如需德州扑克AI机器人,请点击

https://www.moshike.com/a/5540.html 


根据伦敦大学学院的(AlphaGo的开发者就来自该校)相关信息,扑克策略能够帮助研究人工智能的科研人员解决一些社会重大难题。

机器人在一些包含逻辑性和技巧性的游戏,比如象棋,扑克中与人战斗并不是什么新鲜事了。科研人员们现在非常有自信的认为机器人可以促进创新技术的发展,比如无人驾驶汽车等。

作为一个扑克玩家,我们都知道无限注德州扑克是一种信息不完整的博弈游戏。虽然象棋也极其复杂,但它至少是以完整的信息为基础的。简而言之,无限注德州扑克中包含无数的未知变量。这也是为什么AI研究人员将无限德州扑克视为最后的边界。鉴于此,伦敦大学学院的Johannes Heinrich表示这些给他以及他的研究团队带来了一系列难以克服的棘手问题。

德州扑克AI机器人

虽然面临着巨大的障碍,但是Johannes Heinrich很有信心的认为在不久的将来AI机器人可以在无限注德州扑克中击败人类玩家。当这一天到来的时候,这些重大科技进步也将会应用到其他重要领域。

若要破解在打扑克过程中的各种动态因素,Heinrich解释说AI机器人的行动应该主要基于两点:神经网络系统和强化学习系统。将这两个系统相结合可以让机器人的学习方式更像人。

德州扑克AI机器人

以扑克为例,通过与自己打数十亿手牌,机器人从自己的错误当中学习(强化学习系统)。通过神经网络系统,机器人可以分析这些结果,学习抽象的模式。最终达到的效果就是系统能够接受/学习知识并运用到未见过的情形中。从本质上来说,这台机器人要能够像人一样概括和假设新的环境。在过去,这一点是不可能的。过去机器人只能处理曾经分析过的情形。

目前,这种系统还处于研发阶段。如果科研人员能够解决AI机器人中评估未知变量以及运用知识这两个难题,那就意味着AI机器人不久之后就能够破解扑克。除此之外,这一重大科研成果也可以运用到医疗、驾驶等其他领域中。

德州扑克AI机器人

在真实世界中,扑克是一种有关不确定性的游戏。玩家并不知道其他对手手里的牌。也不清楚以后会有什么牌。在类似围棋或国际象棋的游戏中,所有玩家都可以看到棋盘。每个玩家的信息都是完整的。这使得围棋和国际象棋要比扑克容易玩得多。


在完整信息博弈中,计算机可以在决策树中进行分析,CMU 教授 Tuomas Sandholm 解释道,他与自己的博士生 Noam Brown 共同开发了 Libratus 系统。在国际象棋和围棋中,人工智能可以通过预测所有未来步骤的胜率来思考自己的下一步。然而在不完整信息博弈中,事情就变得复杂起来了,你不知道对面手握什么底牌,Sandholm 解释道。这意味着你不能在决策树的架构下选择下一步了。而且,你也不知道发牌员在 flop、turn 和 river 上发出的下一张牌是什么。


德州扑克AI机器人

当这些扑克玩家每一次做出动作时,这些动作都会被传输到位于5英里之外的卡耐基梅隆大学的一台计算机服务器。通过这台服务器,信号将被再传输12英里,至位于门罗维尔郊区匹兹堡超级计算机中心上运行的一款名为“Libratus”的软件。


Libratus同时玩8手牌--与每位选手同时玩两手牌。它从容不迫的做出决定,缓慢的速度让对手贾森·赖斯(Jason Les)几近疯狂。“它让时间变得更长,”赖斯说。“等待不应该影响我,但有时你会喜欢‘好吧,这是要结束了吗?’”


当然,Libratus永远不需要休息。在其它方面,它也不同于人类玩家。当投入更多的赌注时,人们倾向于思考更长的时间。Libratus在投入的筹码较少时玩的非常慢,因为手中有更多的筹码,它必须考虑到所有的可能性。Libratus还会违反标准投注习惯,突然加大筹码,不定时投入不规则数量的筹码。


对于人类扑克玩家来说,这样的行为是恼人的、鲁莽的,从长期来看也是代价高昂的。但是作为扑克玩家,Libratus的主要贡献就是它的无人性。


当为期20天的赛事在大河娱乐场结束时,职业扑克玩家合计输了180万美元。(事实上他们并不需要投入任何钱,这个数值只是在扑克比赛中用于计算得分。)


德州扑克







德州扑克