新利18娱乐

首页 > 正文

世界上最会打牌的 15 个人,输给了这个「赌神算法」

www.rf-millenium.com2019-07-28
新利18官网登录

  上次AI战胜人类玩家,还是AlphaGo机器人和韩国围棋冠军对抗。

现在,一个叫做Pluribus的AI和世界扑克冠军PK再次击败了人类。

但突破的是,这一次不再是一对一的,对手是15位顶级扑克玩家。这也是AI首次在超过两人的比赛中击败了人类球员。

这场德州扑克赛事持续12天,以最受欢迎的六人无限游戏形式拥有超过10,000手牌。 Pluribus和15名顶级球员有两种模式。

[

▲游戏示例,人工智能系统(Pluribus)和五名职业扑克玩家抗争。图片来自:Facebook

第一个是Pluribus和5个人类玩家,第二个是1个玩家和5个Pluribus(这些Pluribus彼此不匹配),第二个形式是2个扑克传奇。角色 DarrenElia和Chris Ferguson,六次赢得世界冠军。

结果,Pluribus全部胜利。

如果它是一个人类玩家,一块价值1美元的筹码,Pluribus将能够以每小时1,000美元的惊人速度赢得胜利。

[

▲图片来自:GettyImages

这项成就今天也发表在《科学》杂志上,该杂志详述了人工智能Pluribus是如何创建的。

Pluribus由Facebook的人工智能团队和卡内基梅隆大学的计算机科学系开发。两年前,他们开发了一款名为Libratus的扑克游戏系统,该系统一直是德州扑克单挑局中的世界。优胜者。

在单人游戏中,游戏理论可以为AI提供最佳策略,因此AI可以完全控制游戏中的“特定路线”,预测每个游戏的结果,然后决定下一步。

这件作品的多人游戏场景不起作用。

[

▲图片来自:AlexandreRotenbergAlamy

总之,Libratus无法确定所有玩家手中的牌是什么,无法理解对手的内心思想,无法弄清楚对手的诱惑或虚张声势,以及他们的每个投注决定,游戏都可以说要指数复杂。

因此,研究人员在Libratus的基础上建造了Pluribus。不同之处在于,一种称为搜索功能的新机制用于期待下一个未知行为,而不是在预测最终结果后推回。

在处理其余玩家的复杂性时,这种短期敏锐性恰恰是最大的优势。

[

此外,Pluribus算法的战略核心是它不会根据人类玩家或以前的AI数据的经验训练算法,而是通过面对自身不断改进。

经过数万亿的扑克游戏,它创造了一个基本的策略模型,能够在没有人为干扰的情况下对抗自己的副本,然后从游戏中借用它并根据情况自由地玩。

因为它是在没有人类信息输入的情况下训练的,所以它可以想到人类玩家不会使用的许多策略。

[

这些进步也表明,AI可以用更少的资源和更低的成本制造。

Pluribus仅在8天内创建,而不是10万美元的高级系统,云服务器的培训成本不到150美元。

Pluribus只需两个CPU即可运行,而2016 AlphaGo系统使用1,920个CPU来赢得游戏。而且Pluribus内存不到128GB,平均每次只有20秒,是专业扑克玩家的两倍。

这一成就也是衡量人工智能进展的好方法。

与国际象棋,跳棋和游戏不同,扑克游戏隐藏信息和运气,这意味着它不仅可以计算人类行为,还必须超越它们。因为Pluribus已经可以对抗该领域的许多顶级人类,研究人员说,客观地说,人工智能被证明被称为“超人”。

[

▲图片来自:Gizmodo

对于后续开发,联合开发者NoamBrown认为Pluribus已经达到了扑克的极限并完成了最后的挑战。接下来,该技术将用于更多场景。

毕竟,AI可用于多人游戏场景,它可以处理隐藏的信息,这更符合现实生活中的挑战。扑克游戏只是提供了一个真实世界的模型。

[

▲图片来自:unslash

NoamBrown说:

该研究将适用于各种环境,如网络安全,欺诈检测,财务谈判等,甚至可以帮助自动驾驶汽车导航。

但是Pluribus的算法代码不会像早期的系统迭代一样开放,毕竟它可能会破坏在线扑克世界。

热门浏览
热门排行榜
热门标签
日期归档