AI扑克机器人Pluribus:挑战人类扑克玩家

作者:丹尼尔·史密斯2025年06月12日

又一个拥有“超人”力量的人工智能(AI)机器人让扑克玩家面临危险。

AI poker bot
AI扑克机器人Pluribus已经表明,机器可以在自己的游戏中击败高水平的专业人士。(图片:CIO.com/Thinkstock)

经过二十年的发展,AI扑克软件现在可以击败多人无限注德州扑克游戏。

Pluribus的近期表现被首席开发者Tuomas Sandholm誉为一项重大突破,它击败了一群世界级玩家。

AI 对战多位顶级职业选手

Sandholm和Noam Brown在《科学》杂志上概述了最新的机器对战人类的战斗,他们设计了两种场景。

第一种是五位职业选手组成的小组对抗一个版本的超级计算机。另一种是两位职业选手单独对抗一组AI扑克机器人。

在被选入五人对战一台计算机比赛的13位职业选手中,包括Greg Merson。凭借超过1100万美元的现场收入和2012年WSOP主赛事冠军的头衔,Merson对任何人来说都是一个严峻的考验。

然而,经过10,000手牌和12天的比赛,即使是这位美国人的技能也无法击败Pluribus。根据结果显示,该AI软件的平均胜率为每局48毫大盲注(mbb/game)。

赢得一场胜利后,Chris Ferguson,又名Jesus,和Darren Elias加入了战斗。每人对战五个版本的扑克机器人,这些职业选手在10,000手牌的比赛中尽其所能。

不幸的是,对于人类来说,即使是Ferguson的神圣努力也无法确保胜利。尽管这对组合表现更好,但Pluribus的总体胜率仍然达到了32 mbb/game。

五个令人恐惧的事实:我们从人类对战Pluribus中学到了什么

  1. 2017年,Libratus由100个CPU提供动力。 2019年,Pluribus只需要两个。
  2. Pluribus使用的内存不到128 GB,这意味着它可以在云服务器上运行,成本低于150美元。
  3. 在多人设置中,Pluribus平均每手牌需要20秒,是普通人类玩家的两倍。
  4. Pluribus是完全自学的。在编程了无限注德州扑克的规则后,开发者让它自己学习并设计自己的策略。
  5. 尽管Pluribus在游戏开始时就有一个最佳玩法蓝图,但它会对其数据库进行实时搜索,并可以根据对手的行动进行调整。

自学扑克机器人

在同时挑战多个玩家之前,该AI程序自己玩了数万亿手牌。使用一种称为“强化学习”的技术,它在短短20个小时内就达到了世界级水平。

虽然这一事实已经足够令人印象深刻,但Sandholm表示,该软件能够同时击败多名玩家的能力超出了预期。

尽管他之前的项目Libratus证明了一个机器人可以击败一个玩家,但击败五位顶级扑克高手,任务要困难得多。

然而,经过12天的下注和虚张声势,开发者现在有信心AI不仅可以在扑克中蓬勃发展,而且可以在现实世界中蓬勃发展。

在他们看来,能够对抗多个对手制定战略,可能有助于网络安全、医疗保健和金融等领域。

Pluribus为玩家提供了一些积极因素

对于扑克玩家来说,最新的失败可能是一个不祥的信号。然而,也有一些积极的因素。

从策略的角度来看,Pluribus的战术可能会复兴donk bet。经常被专家诟病,在下一轮街上下注并对加注者下注的行为,可能比最初想象的更有效。

为什么机器人会得出这个结论尚不清楚。然而,它在比赛中的移动“远比”专业人士更频繁。

Pluribus还再次确认了limping是一种糟糕的策略。虽然它最初在学习阶段尝试了这个举动,但该程序最终确定加注或弃牌是最佳选择。

虽然我们可能没有处在AI接管的边缘,但时间可能不多了。2017年,MatchPoker进行的研究表明,无限注德州扑克对AI来说仍然过于复杂,无法解决。

快进两年,Pluribus证明了这一理论是错误的。更重要的是,该软件运行在云服务器上,运行成本仅为144美元。

在总结最新结果时,Sandholm和Brown承认,AI远非完美。然而,即使在复杂的不完美信息环境中,当前的技术也可以产生“超人”策略。