当前位置:首页 > 智能硬件 > 人工智能AI
[导读] Darren Elias是一名扑克玩家。今年32岁的他是唯一一个赢得过四次世界扑克巡回赛冠军的人,在锦标赛上获得的奖金累计超过700万美元。尽管他已经相当专业了,但今年春天他还是从一个人工智能机

Darren Elias是一名扑克玩家。今年32岁的他是唯一一个赢得过四次世界扑克巡回赛冠军的人,在锦标赛上获得的奖金累计超过700万美元。尽管他已经相当专业了,但今年春天他还是从一个人工智能机器人身上学到了一些新东西。

Elias正在帮助测试由Facebook人工智能实验室和卡耐基梅隆大学研究人员共同开发的一款新软件。他和另一名职业玩家Chris Ferguson各打出了5000手,对战五个名为Pluribus的机器人副本。

最后,机器人以很大的优势领先。在这个过程中,Elias注意到一些事情:虽然机器通常被认为是缺乏灵感的,但这个机器人比一般的扑克专家更有胆量。Elias说:“它会赌上两三倍的赌注,而人类不会这么做。我对它们下的巨额赌注很感兴趣,以后将在自己的扑克比赛中尝试。”

Pluribus的胜利具有里程碑式的意义,不仅仅是因为一个新机器人向专业的玩家教授了新策略。这款软件是第一款在多人游戏《德州扑克》中击败顶级专业人士的游戏。周四发表在《科学》杂志上的一篇论文描述了Pluribus是如何战胜Elias和Ferguson的;在一个机器人副本与5名人类专业人士进行的10000手扑克游戏中,Pluribus也轻松获胜。

“如果你让这个机器人与5名精英专业人士在一起比赛,机器人可以打败他们,而且能从他们身上赚钱。”Facebook人工智能实验室研究员、Pluribus联合创始人Noam Brown表示,“就扑克而言,这真的是黄金标准。”

Brown与卡内基梅隆大学教授Tuomas Sandholm共同创建了Pluribus。Brown之前是桑德霍尔姆实验室的一名研究生,两人于2017年建造了一个名为Libratus的机器人,成为第一个在双人模式下击败专业人士的软件。Brown在加入Facebook后启动了Pluribus项目,但他说这家社交媒体巨头并没有考虑这项技术的具体应用。他说:“项目的目标是对不完全信息和大规模多代理系统进行基础研究,”,这句话也恰当地描述了Facebook的主要服务。长期来看,在Pluribus上测试的想法可以帮助自动驾驶汽车预测其他司机的行为,或者改进欺诈检测算法。

Sandholm说,他已经证明了这款软件的商业价值,以及国家安全价值。他创办了两家公司,将他实验室的人工智能战略技术商业化。Pluribus与Libratus的相似之处在于,它通过与自己的版本进行数万亿手的对弈来积累技能。在每一次尝试之后,系统都会回顾发生了什么,以及哪些可能会有更好的表现。所有改进都会添加到它的核心策略中。

在很大程度上,这款新机器人能够玩比它之前的版本复杂得多的游戏,因为它更擅长微调核心策略,通过预测游戏中某个特定点的可能结果,即搜索功能。Brown和Sandholm早期的机器人试图绘制出游戏最后可能出现的所有问题。但六人游戏的可能性几乎无穷无尽,要探索需要太多的计算能力。

相反,Brown和Sandholm开发了一个搜索功能,它一次只向前移动几步。为了避免令人不快的意外,还将考虑如果对手改变策略,不同行动的价值将如何变化。因为在像扑克这样的游戏中,有些信息是隐藏的,所以这种搜索功能以前还没有很好地应用。

Brown表示,这种新方法的优势还在于对计算能力的要求不高,使得运行Pluribus的成本相对较低。这款机器人需要在一个64位处理器内核的强大服务器上与自己进行8天的对战,才能掌握这款游戏,而为DOTA 2等复杂电子游戏开发的人工智能机器人则需要在数十万个处理器上进行数周的培训。“花150美元在云计算服务上就可以开发类似的东西,因此将其应用到其他领域是切实可行的,”Brown说。

这对搭档在编写代码时没有考虑的一点是要在扑克中赢钱。“我们不会发布代码,部分原因是这将对在线扑克社区产生重大影响,”Brown说。“我们正试图让人工智能社区的人们能够接触到这一点,而不是那些想制作扑克人工智能的人。”尽管如此,他承认这些技术无论如何都有可能传播开来。一年后,还会有人开发出类似于Pluribus的机器人吗?“我认为这完全有可能,”Brown说。

Elias对此有所期待。他说,自从Libratus出现以来,由于机器人变得更加复杂,人们不再那么热衷于玩高风险的在线游戏。他还表示:“如果你在玩一个高风险的在线游戏,你很可能是在和一个机器人或由机器人帮助的人类对战。”Elias说,扑克专业人士和爱好者不应该被最新的人工智能技术所吓倒,它可以提高游戏的水平。他很乐意帮助测试Pluribus,因为他欣赏人工智能的科学,以及像押注更大价值这样的新见解的潜力。

尽管如此,他还是承认自己有点难过。终极扑克机器人Pluribus的问世,标志着扑克游戏的一个历史性转折点。他说:“从16岁开始,我就开始打扑克,并把我的一生都奉献给了它,现在被机器打败是一件很丢脸的事。自人工智能第一次获胜之后,人类就很难再赢过它了。”

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭