当前位置:首页 > 芯闻号 > 极客网
[导读]谷歌DeepMind发布消息称,它所开发的AI系统AlphaProof和AlphaGeometry 2在数学上取得突破,解答了今年国际数学奥林匹克竞赛(IMO)6道题中的4道,相当于银牌水平。

谷歌DeepMind发布消息称,它所开发的AI系统AlphaProof和AlphaGeometry 2在数学上取得突破,解答了今年国际数学奥林匹克竞赛(IMO)6道题中的4道,相当于银牌水平。

谷歌还自豪宣称,这是AI第一次取得如此耀眼的成绩。可惜就像之前所鼓吹的其它AI一样,谷歌的说法也有夸大之嫌。

离金牌线只有一步之遥

根据谷歌的解释,AlphaProof用增强学习技术在开源求证辅助系统Lean环境中证明数学命题。Lean是微软公司计算机科学家莱昂纳多·德莫拉开发的,采用了由所谓“有效的老式人工智能”(GOFAI)——即从逻辑学汲取灵感的符号人工智能——所驱动的自动推理。

谷歌系统具备自我学习能力,它生成并验证数百万个数学证明,在解决复杂数学问题时进步明显。在此之前,谷歌开发过几何AI模型,AlphaGeometry 2相当于升级版本,它是谷歌以Gemini语言模型作为基础,用大量数据训练出来的。

知名数学家Sir Timothy Gowers和Dr. Joseph Myers用国际数学奥林匹克竞赛标准对谷歌AI系统进行评估,国际数学奥林匹克竞赛的金牌线为29分,总分42分,谷歌系统拿到28分,离金牌线只有一步之遥。在最难的问题上谷歌系统完美解答,今年只有5人解决此问题。

国际数学奥林匹克竞赛始于1959年,面向预科数学天才(也就是还没进入大学的数学天才),主要涉及代数、组合数学、几何和数论。

用竞赛问题测试AI已经成为评估AI推理能力的重要标准。AlphaProof解决了两个代数问题,一个数论问题;AlphaGeometry 2解决了一个几何问题,但谷歌AI被两个组合数学问题挫败。在解决问题时,有一个只用了几分钟,其它耗时较长,最多三天。

谷歌AI用于数学也有局限

为什么说谷歌的说法也有夸大之嫌呢?

首先,谷歌将竞赛问题转化为正式数学语言,方便AI模型处理。这一做法与官方竞赛流程不符,人类参赛者会直接面对问题。

AI模型可以生成文章或者其它形式的文本,但面对复杂数学问题时往往会捉襟见肘,因为当中牵涉到复杂的逻辑推理,这正是目前AI系统所欠缺的。复杂数学问题会涉及到抽象概念、子目标设定、回溯、尝试新路径,这些都给AI带来挑战。

专注于数学和AI研究的剑桥大学研究人员Katie Collins说:“如果你有办法检查答案(也就是正式语言),训练数学AI模型就会容易很多,难点在于网上自然语言(非正式语言)数据超级多,但正式数学语言数据却很少。”

谷歌DeepMind AI可以自动将用自然非正式语言编写的数学问题转化为正式语言,这是谷歌之所以取得突破的关键。爱丁堡大学混合AI讲师Wenda Li说,对于数学社区而言,自动将非正式语言转化为非正式语言是一大进步。

在参加今年的竞赛之前,AlphaGeometry 2曾尝试解答之前25年积累的国际数学奥林匹克竞赛几何问题,83%都能解答——之前的AI只能解答53%。面对今年的几何问题,谷歌系统只用19秒就给出答案。

其次,谷歌AI模型花费的时间有时显著过长。Sir Timothy Gowers承认DeepMind模型取得突破,表现远超之前的自动定理证明者,但AI解答时花费的时间远长于人类参赛者,有些问题需要的时间甚至超过60个小时,AI的处理速度本来比人类快很多,但还是需要更长时间,如果人类参赛者有同样长的时间解答,得分肯定更高。

Sir Timothy Gowers还说,在正式答题之前,人类已经手动将题目转化为正式语言Lean,然后AI才着手处理,虽然核心数学推理是由AI完成的,但“自动化”步骤却由人类操刀。

替代数学家还需时日

到底谷歌系统会给数学研究造成什么影响?Sir Timothy Gowers只能说“不确定”。他表示:“是不是到了数学家即将成为多余的地步?很难说。我想我们离这个目标还差一个或者两个突破。”

他认为,谷歌系统解答时需要更长时间说明AI并没有很好解决数学问题,但在操作时应该发生了一些有趣的事情。

虽然存在诸多局限性,Sir Timothy Gowers仍认为类似的AI系统将会成为富有价值的研究工具。在程序的辅助下,对于那些不是特别难的问题(几个小时就能解决),AI可以帮助数学家寻找答案,如此一来,即使AI本身无法解决开放问题,也能成为数学家的实用工具。

不管怎样,开发一套AI系统,让它解决富有挑战的数学问题,可以为未来的人机协作扫清障碍,还可以让人类深入了解自身是如何解决数学问题的。

当然必须意识到,在人类解决复杂数学问题方面,目前还有很多未解之谜,AI也一样。(小刀)

声明:该篇文章为本站原创,未经授权不予转载,侵权必究。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭