赛灵思推出首款ACAP芯片,面向人工智能推理市场
扫描二维码
随时随地手机看文章
赛灵思刚刚推出了首款ACAP芯片;
新芯片面向人工智能推理市场,预计该市场将比英伟达目前主导的人工智能训练市场更大;
有朝一日,赛灵思会像英伟达一样成为数据中心市场的主要选手吗?
9月,Evercore ISI发布了半导体股票的“Magnificent 7”名单。上榜的有英伟达和美光等常客,还有一家令人意想不到的公司-赛灵思。众所周知,赛灵思是现场可编程门阵列(FPGA)市场的领导者,具有突出的技术领先优势和市场份额。FPGA是一种可配置的集成电路,尽管有些困难,但可以使用软件对其进行功能配置。Evercore表示,之所以把赛灵思放到推荐股名单中,是看中了它在数据中心市场的长期优势。Evercore的先见之明得到了赛灵思的背书,一个月后,赛灵思推出了一款极具创新性的产品 - Everest(珠穆朗玛峰)。
赛灵思在其核心市场-无线基础设施、视频、音频和广播设备-取得了令人瞩目的成功。此外,其新任首席执行官Victor Peng也经常提醒世人,赛灵思现在把数据中心市场视为公司业务增长最大的领域,是公司未来面向的首要阵地。10月份,赛灵思推出了其新近推出的自适应计算加速平台(ACAP)的第一个产品系列Everest,以及一系列产品代号为Versal(‘ver’代表“多功能”,‘sal’代表“通用”)的第一批ACAP芯片。
Versal
Versal基于台积电7nm工艺打造,结合了软件可编程性和针对特定领域的硬件加速以及当今快速创新所必须的高度适应性。Velsal包括六款器件,采用独特架构,具备高度可扩展性,实现了可满足包括云、网络、边缘计算、无线通信和终端节点等各种应用市场需求的AI推理性能。你可以把Versal视为SoC界的瑞士军刀,它继承了CPU、GPU和可用于数据中心加速的FPGA。
在某些方面,Versal类似于赛灵思自家的Zynq Ultrascale + MPSoC,但它具有某些重要的额外功能,可以大大简化开发和部署,因为在Versal上,既可以由软件控制系统,还可以在已知配置上运行。Versal缩减了中央FPGA模块的尺寸,为额外的DSP、ARM内核、推理组件和I/O模块腾出了足够的空间。
时值英特尔和AMD联手在其x86器件上集成GPU和英伟达在其芯片上增加用于深度学习的额外内核之际,该产品的推出时机也堪称完美。
根据Tirias Research的分析师Kevin Krewell的说法,Versal是赛灵思‘努力入局,与英特尔和英伟达同场竞技的举动。’
在AI市场挑战英伟达
今年5月份,赛灵思CEO Peng向Data Center Dynamics透露,Everest是赛灵思历时4年,动用了1500名工程师,投入超过10亿美元研发而成的。显然,对于一家典型研发费用为一年6亿美金的公司而言,10亿美金绝对是一笔庞大预算。在采访中,他对赛灵思迟迟无法撕掉“FPGA公司”的标签感到沮丧,对于业界仅仅将Versal视为FPGA的一次升级更是无法释怀。
“我们一遍又一遍地向业界传达‘不要把Versal当成一款FPGA’的信息,因为作为一家传统的FPGA公司,我们现在不得不说,‘不,我们不再是单纯的FPGA公司了。’现在有了ACAP,尽管现在还没有人知道ACAP到底是什么,但是他们终究会明白的。”
事实上,Peng说他希望赛灵思被视为一家“以数据中心为优先”的公司。赛灵思看到了人工智能和机器学习产生大量需要收集和分析的数据的新趋势,同时5G网络将对其专有的自适应计算加速硬件产生巨大需求。有趣的是,赛灵思声称Versal芯片的能效可以达到英伟达的GPU的四倍,推理性能可以达到英伟达的2-8倍,在处理推理性工作负荷方面比英特尔的Xeon CPU快43-72倍。
赛灵思这种判断相当大胆。不过并非没有先例。现在,英伟达有大约6亿美金或者说20%左右的营收来自于其针对AI优化的数据中心硬件,而这一数字在几年前几乎为零。赛灵思对数据中心市场寄予厚望,是为了复制英伟达的GPU在数据中心领域的成功,但是Peng也承认,预测新业务发展的轨迹很难。
“我很难预测它会怎样发展,”Peng说。“这是一个全新的领域,没有路线图,对所有人都是全新的。我的意思是说,谁能预料到英伟达今日的成功呢?英伟达自己也没有预料到吧!”
深度学习:训练和推理
深度学习一度因为需要极高的计算强度而被AI社区抛弃并扫进技术的垃圾堆,但它现在成为了许多AI应用的核心。深度学习可以将复杂任务进行分解,从而使得机器学习成为可能。今天,在某些情况下,一些通过深度学习算法进行图像识别训练的机器甚至可以比人类表现得更好。谷歌的Alpha Go通过深度学习,反复训练并调整其神经网络,最终在2017年击败了全球最棒的围棋选手柯洁。
深度学习可以分为两个过程:训练和推理。神经网络的训练是指将数据输入到系统中,各个神经元都会为其输入分配相应的权重。训练是一种计算密集型任务,因为训练算法本身不会告诉神经网络什么才是正确的答案,而是允许它反复“猜测”,直到它几乎每次都能够选择正确的答案,比如,这张图片到底是不是猫。
在数字世界里,训练好的神经网络利用所学到的东西开始工作,以一种简化的应用识别说话、图像、各种疾病,或者建议一个客户接下来可能购买的东西等。完全加权的神经网络通常是一个笨重而庞大的数据库。推理过程则简化所有数据,对它进行压缩和优化,以在运行时加速性能。谷歌的语音识别、图像搜索、恶意软件检测、垃圾邮件过滤和Netflix推荐引擎等任务都使用了某种形式的推理。
GPU拥有并行计算能力(能够同时处理多个任务),已经被用于AI训练和推理。但是,推理任务的性能目标和训练任务有所不同,推理批量输入的数据量较少,以便最大限度减小网络的端到端响应时间。比如,基于云的图像处理任务需要具备高度响应性,以便系统不会堆积了大批图像而造成用户等待上好几分钟。因此,高吞吐量对训练任务更为重要,而低延迟对推理任务更为关键。Versal等可编程硬件完全符合低延迟、低功耗、高频的AI推理工作负荷。
AI开发人员可以利用Versal的异构硬件和以软件为中心的方案。赛灵思这种先行者的发展空间可能很大,赛灵思和巴克莱分享了对AI市场的预测,它认为AI推理可能比AI训练的市场更大,目前的AI训练市场大部分都被英伟达的GPU把持着,边缘节点和数据中心的推理应用则是赛灵思为Versal设定的目标。赛灵思预计,该部分市场的规模将从目前的几乎为零增长到2023年的接近230亿美金。
赛灵思-新的英伟达?
过去两年中,赛灵思积极拓展产品的边界,除了FPGA,其产品组合加入了几个SoC的身影,现在又多了个ACAP。随着人工智能、5G和物联网开始起飞,赛灵思的ACAP将找到广阔的应用空间。也许几年后,投资者会回首当下这个关键时刻,正是从赛灵思发布ACAP起,它开始从一家纯粹的FPGA公司蜕变为像英伟达这样的数据中心市场主要厂商。
赛灵思已经扔下战书,可以期待下英伟达如何接受挑战。不过,如果巴克莱/赛灵思对人工智能推理市场估计有误,那赌注就太高了。有传言称,博通在收购高通失败后,可能会将并购重心转向赛灵思。英伟达过去一直收购图形和游戏行业的公司,或许它可以学一学英特尔,试着买下赛灵思?