当前位置:首页 > 智能硬件 > 人工智能AI
[导读] 人类可以轻松地识别事物并对其行为进行推理,这是我们认知发展的核心。即使是儿童,他们也会根据物体动态对其进行细分,并用持久性、稳定性、连续性的概念来解释物体发生了什么,以及推测在其他情况下物体会发

人类可以轻松地识别事物并对其行为进行推理,这是我们认知发展的核心。即使是儿童,他们也会根据物体动态对其进行细分,并用持久性、稳定性、连续性的概念来解释物体发生了什么,以及推测在其他情况下物体会发生什么。

受此启发,为了简化人工智能模型的视觉识别问题,来自麻省理工学院-IBM Watson人工智能实验室、麻省理工学院计算机科学与人工智能实验室、DeepMind和哈佛大学的一组研究人员引入了一套动态视频推理基准——CLEVRER,并开发出了一套能预测物体运动的模型。

CLEVRER包含了由物理引擎生成的2万多个时长为5秒的碰撞物体视频,每个视频里包含了三种形状、两种材料和八种颜色。同时还包括30多万个问题和答案。这些视频和问题全部都集中在逻辑推理的四个要素上:描述,什么颜色;说明,什么原因造成;预测,接下去会发生什么;反事实,如果发什么。

模型运行示意图

通过解析CLEVRER,研究人员确定了在描述性、解释性、预测性和反事实性问题上,训练AI模型需要的内容,分别是:对物体、事件之间的运动、因果关系,以及背后的逻辑关系进行推理的符号描述。随后,研究人员据此开发了神经符号动态推理模型(NS-DR)。

这个模型实际由四个部分合成。分别是:视频帧解析器,神经动态预测器,问题解析器和符号程序执行器。给定输入视频,视频帧解析器会检测场景中的对象并提取其轨迹和属性(即位置,颜色,形状,材质)。形成视频的抽象描述后,将其发送到神经动态预测器以预测对象的运动和碰撞。问题解析器接收输入问题以获得代表其逻辑的功能程序。然后,符号程序执行器在动态场景上运行该程序并输出答案。

根据该团队报告,在用1000个程序应用了该模型后,他们的模型对问题的识别准确率达到了88.1%,优于其他基准模型。在解释性,预测性和反事实性问题上,则有更好的表现。

研究人员指出:“ NS-DR 将动态规划纳入视觉推理任务中,可以直接预测未观察到的运动和事件,并可为预测性和反事实性任务启用。其次,符号描述为视觉,语言,动力和因果关系提供了强大的基础。通过设计,它使模型能够明确捕捉视频的因果结构和问题背后的逻辑构成。”

不过,研究人员也承认,即便训练所需的数据量相对较少,但模型在实际应用中仍很难使用。此外,在需要长期动态预测的任务(例如反事实问题)上,NS-DR的性能也没有那么高,这表明未来仍需要一种能够生成更稳定和准确轨迹的动态模型。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭