人工智能将成为新基建发展的重要建设目标
扫描二维码
随时随地手机看文章
中共中央政治局常务委员会召开会议,提出要发力于科技端的基础设施建设,人工智能成为“新基建”七大版块中的重要一项。“新基建”不同于“铁公基”传统思路,其本质是信息数字化的基础设施建设,用于支撑传统产业向网络化、数字化、智能化方向发展。那么对于人工智能而言,“新基建”到底有何特点呢?笔者认为,与仅聚焦基础硬实力建设的传统基建思路不同,人工智能新基建更需要以应用需求为目标,发力软硬协同,融合新老系统,培育全新生态。那么在“新基建”浪潮的背景下,人工智能基础设施应该建什么、怎样建?
建什么:聚焦算力提升,培育协同生态
当前,摩尔定律失效,算力需求增速已经远远超过了算力供给能力。人工智能所需的基础算力具有独特性。因此,人工智能新基建的核心是构建专用设施,填补算力不足,同时应在泛在、融合的发展趋势下,构建软硬件协同、新老系统协同、各个行业协同的产业新生态。
一是继续夯实通用算力基础。当前算力供给已经无法满足智能化社会构建,根据OpenAI统计,从2012年至2019年,随着深度学习“大深多”模型的演进,模型计算所需计算量已经增长30万倍,无论是计算机视觉还是自然语言处理,由于预训练模型的广泛使用,模型所需算力直接呈现阶跃式发展。据斯坦福《AI INDEX 2019》报告,2012年之前,人工智能的计算速度紧追摩尔定律,算力需求每两年翻一番,2012年以后,算力需求的翻番时长则直接缩短为3、4个月(如图1所示)。面对已经每过20年才能翻一番的通用计算供给能力,算力捉襟见肘已经不言而喻。
图1 深度学习算力递增示意图(来自《AI INDEX 2019》)
二是全面提升专属计算能力。经过近两年的研究及应用实践沉淀,产业界逐渐发现以机器学习为代表的人工智能计算具有独特性,具体表现在3个方面:第一就是机器学习计算大部分场景仅需要低精度计算即可,经过推测,一般应用场景下8比特即可满足95%以上需求,无需FP32、FP16等高精度计算;第二就是机器学习计算只需要很小的操作指令集,在过去40年中开发的众多使得通用程序能够在现代CPU上以高性能运行的机制,例如分支预测器、推测执行、超线程执行处理核、深度缓存内存层次结构等,对于机器学习计算来说都是不必要的,机器学习只需要高性能运行矩阵乘法、向量计算、卷积核等线性代数计算即可;第三就是分布式特性,随着模型不断增大,深度学习“大深多”模型已经无法在单片芯片完成计算,多芯片多场景的异构计算需求使得机器学习计算必须考虑分布式的计算通信以及计算任务的协同调度,实现密集且高效的数据传输交互。
三是提前布局系统协同生态。基于对产业界解决方案的梳理分析,笔者对于人工智能工程发展态势有如下研判:为了更好满足应用泛化的需求,未来人工智能应用及产业发展将呈现多平台多系统协同态势,以实现更为广泛的赋能。可以看到,当前阶段,人工智能的主要赋能方式还是通过通用平台,以聚合提供人工智能基础技术能力的方式进行赋能,面向端侧的一些成熟应用场景也出现了软硬一体的端侧应用系统,如自动驾驶平台、智慧安防摄像头、基于智能语音语义的智能音箱、终端翻译机等。但是通用平台无法实现广泛赋能,目前市面上的端侧应用也是功能单一且能力固化。
在通用领域,通用平台将进一步分化为提供人工智能基础能力的基础平台和融合行业基础应用的行业平台两个方向(如图2所示)。实际上,现在阿里的城市大脑、腾讯的医疗优图等平台,就已经开始呈现出从基础通用功能平台向行业应用能力平台演进的态势。
在专用领域,现有的端侧应用无论是功能还是可扩展性上都远远达不到实际的泛化应用需求,因此未来面向泛化应用将呈现专用系统这个形态,专用系统最大特点是它不仅仅是端侧应用的软硬件固化,而是通用平台、行业平台和端侧应用的协同组合,以软硬一体的方式实现具体应用的功能定制和扩展。这种工程发展态势将对产业生态产生巨大影响,现在谈及的人工智能芯片和框架,其实都属于通用平台和端侧应用范畴,其生态主体是提供人工智能技术的科技企业,而到了专用系统阶段,系统协同将成为主流,融合通用能力、行业能力、业务逻辑的专用系统将由垂直行业来牵头打造,人工智能的生态主体也将逐渐变成人工智能技术的使用者,即各个垂直行业的传统企业。
图2 人工智能未来发展态势分析
怎样建:构建三大能力,抓住机遇窗口
在此背景下,人工智能基础设施建设应当建设以下3方面能力。
一是建计算加速能力。首先是建设面向训练及推理的计算芯片。随着人工智能融合赋能广度和深度的不断加强,不同场景应用将提出不同算力需求,以物联网、移动终端、安防和自动驾驶为代表的专用端侧推断芯片百花齐放,人工智能正式进入算力定制化时代。为更好解决当前训练算力昂贵、推理计算不足的局面,应聚焦功能多元化、架构多元化的人工智能基础设施建设,针对性补充机器学习专属操作计算能力,面向数值计算并行、数据跨域交换等进行攻关建设,积极探索多元化架构,以类脑计算、量子计算范式为突破口,实现机器学习计算能力加速。
其次是全面构建面向深度学习计算加速的理论及工程体系,全面涵盖从算法顶层、编译器,到体系结构等方面的加速理论及工程实践能力,以大规模分布式学习需求为指引,优化算法实现、打造深度学习编译器,探索体系结构与硬件的最优实践。
二是建计算泛在能力。端侧是人工智能最终应用的落地点,端侧既是数据的生成端,也是数据的使用端,需要构建能够满足海量不同端侧应用场景下的计算支撑能力。端侧由于受到实时性、硬件能力、功耗等多种限制,需要针对人工智能模型实现不同层面的优化,全面提升端侧的数据计算、采集及传输能力,综合考虑传感器、端侧芯片、端侧软件框架、网络架构演进、数据中心协同等关键因素,构建能够实现机器学习模型训练、部署及动态更新的云端协同算法及工程实现能力,打造坚实的泛在计算基础。
三是建协同生态能力。如图2所示,未来人工智能通用平台、行业平台以及专用系统将呈现三大协同态势,需要抓住窗口期,全面建设全新的系统协同能力。首先是构建3个系统间的协同能力。通用平台、行业平台以及面向具体应用的专用系统之间的功能界定将越来越明确,相关功能将呈现模块化特性,并且高度互补,以实现深度协同。
其次是构建专用系统的软硬协同能力。面向应用的专用系统为满足业务实时响应要求,除了需要将专属定制算力芯片进行部署外,还需要在软件层面实现两项功能:一是实现软件与定制芯片的高度耦合,以达到性能最优;二是软件需要与垂直行业平台及通用平台做好高效对接,保证调用所需平台功能的实时性;三是构建行业协同能力,面向行业赋能的行业平台将在通用平台基础上,抽取行业业务逻辑,沉淀行业服务能力,实现与行业已有业务系统的无缝对接。值得注意的是,行业平台由其业务属性主导,未来行业平台的建设主体一定是由垂直行业来主导构建的。