7月13日消息,据美国科技媒体The Verge报道,Facebook人工智能实验室和卡耐基·梅隆大学合作设计了一个名为Pluribus的扑克AI。这款程序在一系列六人无限制德州扑克比赛中击败了全球顶尖选手。科学家们表示,这次胜利是人工智能研究的一项重要里程碑。
此前,AI在“战略性推理”方面取得的胜利仅限于二人游戏。二人游戏中,AI采取的策略是博弈论中的“纳什均衡”,即至少确保结果为平局,只要对手犯错打破均衡,AI就能获胜。六人桌比赛,难度升级,“纳什均衡”策略不再适用,AI必须不断争取先手才能获取最终胜利。
据悉,开发者通过“动作抽象化”与“信息抽象化”,降低了游戏的复杂性,而研究人员设计的“有限前瞻搜索”算法,能够让Pluribus通过计算各种动作出现的概率分布,并逐步改善早期策略。
另外,这项技术的难点在于,6个人参加的牌局中,AI只获得部分已知信息,还要应对人类“唬人”的迷惑战术。而在比赛中,Pluribus也会“耍点心眼”,让自己变得难以预测。分析显示,Pluribus会做出一些人类玩家认为不好的决策,以在客观上迷惑对手。
因此,网友所认为的Pluribus与人类进行德州扑克比赛是场“毫无感情的赌博”,这种说法并不十分正确,因为Pluribus不仅解决了多人对局环境下的非零和博弈以及隐藏信息的推理问题,还观察人类玩家的情绪,应对“唬人”等迷惑战术,并进行反迷惑,堪称真正的“Pocker Face(扑克脸)”。
本文编辑:程金平