Achronix告诉你,新一代人工智能硬件需要具备哪些特质
扫描二维码
随时随地手机看文章
【导读】:如今AI的触角已经伸向了市场各个领域,AI离不开硬件,新一代人工智能硬件相较于之前的硬件有什么不一样的呢?Achronix给出了答案。
AI应用覆盖了不同的市场,如自主驾驶、医疗诊断、家用电器、工业自动化、自适应网站和金融分析等等;甚至是将这些系统连接在一起的通信基础设施也正朝着自动化的自我修复和优化发展。这些全新的架构将执行诸如负载平衡等功能,还有根据以往经验来进行预测来分配资源,如无线通道和网络端口等资源。这些应用要求高性能,并且在许多情况下,要有低延迟以成功地响应条件和需求的变化。它们还要求功耗要尽可能的低,其结果是无法在本地完成,机器学习解决方案往往被放在电能和散热器充足的云服务器中。对这些嵌入式系统进一步的要求是:即使在网络不能连接至云端的情况下,也要始终处于待命状态,并且随时准备响应。这些因素结合起来就要求改变硬件设计的方式。
让我们来了解一下通常被用于执行这类计算任务的一些主要硬件器件种类,并分析与它们每种器件相关的优缺点:
中央处理器(Central Processing Unit,CPU)CPU几乎是达到了半导体器件所能拥有的最高灵活性,被构想为一种完全通用的器件,它们也很容易被编程。然而,这种灵活性自然是要付出代价的,在一个通用架构中移动数据和指令所涉及到的大量开销,使CPU相对低效且耗电。其结果是,为了满足当今的计算需求,CPU很快就被淘汰了。因此,设计人员就顺理成章地选择探讨用其它架构来补充这种通用功能。
图形处理器(Graphics Processing Unit,GPU)根据任务要求,另一条途径是考虑图形处理器(GPU)来解决这个问题。GPU从上世纪90年代起就开始进入了兴盛时期,那个时期它们通常被用来帮助个人电脑(PC)中的CPU完成图形处理任务,为此它们还在架构上进行了优化。事实上,凭借其拥有的许多计算内核和数不清的算数逻辑单元,GPU可被用来加速许多不同类型的高度并行功能。然而,其代价是不能执行通用计算任务,并且还相对耗电。
专用集成电路(ApplicaTIon Specific Integrated Circuits,ASICs)在解决方案组合中,最遥远的一端是专用集成电路(ASIC)。它们被专门制造用来支持其目标应用,ASIC可被设计成不在任何其他计算上浪费时间或能耗。然而,正如大多数设计人员证实的一样,ASIC的设计和生产是昂贵的,并对数量有限的功能进行了高的承诺;ASIC在设计和制造完成之后,几乎没有能力去提供更通用的计算或适用其它用途。
我们的很大一部分客户已经到达这个阶段了——设计高性能ASIC来作为解决他们所面临的密集计算需求的唯一方法。然而即便是采用这种方案,许多与我们交流的客户已经在不得不考虑其他可选择方案,以支持他们以更低的整体成本去生产性能更高的器件,以及集成一定程度的功能灵活性。
那么,其它的可选方案是什么呢?FPGA
还有另一种方法。FPGA可提供接近CPU所拥有的灵活性,以及接近ASIC所拥有的效率。与ASIC一样,FPGA允许设计人员实现逻辑算法,提供巨大的并行和硬件优化的解决方案。与ASIC不同的是,FPGA可以在眨眼间用一个新的设计进行重新编程。与CPU或GPU相比,当今FPGA的能效非常高,能够比基于处理器的解决方案每瓦提供远远更多的运算。
但是,还有一种更具吸引力的解决方案。
Speedcore嵌入式FPGA(eFPGA)知识产权( IP)
Achronix已经先行采取了进一步的措施。与其简单地提倡使用分立的FPGA芯片,为什么不将该架构引入到您的CPU或SoC之中呢?并同时仍可享受更多的性能提高呢?
一款eFPGA消除了芯片与芯片之间通信的需求,例如通过PCI-Express这样带宽有限的连接需求,消除了对数据进行串行化和解串行化的需求,并提供了一个极大容量的、直达为FPGA阵列结构的片上互连。这意味着与独立的FPGA芯片相比,可提供高达100倍的性能改善,同时将功耗降低高达50%,并缩小了片芯晶粒的面积,降低系统成本高达90%,及减少了对如稳压电源、元器件和散热器等其它组件的需求。
Achronix的SpeedcoreTM嵌入式FPGA(eFPGA)IP产品可以被集成到ASIC或者SoC之中,以提供定制的可编程阵列结构。客户通过细化其所需的逻辑功能、存储器和DSP资源,然后Achronix将配置Speedcore IP,以满足其个性化的需求。Speedcore的查找表(LUT)、存储器(RAM)单元和DSP64单元都可以像积木一样组装起来,从而为任何特定应用创建最优化的可编程功能阵列结构。Speedcore eFPGA目前已经在台积电(TSMC)的16nm工艺上验证量产,并在开发用于TSMC的7nm工艺的产品。Speedcore eFPGA由Achronix的经过实际芯片验证的ACE设计工具提供支持。
在其他几个优势之外,Speedcore eFPGA解决方案可提供缓存一致性、共享存储资源,以实现更快速地导入和导出数据,且能在2ms内对每10万个查找表重新配置其整个架构。
诸如多核CPU、通用图形处理器GPGPU和独立FPGA芯片等现有解决方案都可被用来支持如深度学习等先进的人工智能算法;但随着机器学习架构的发展,它们的局限无法满足开发人员对硬件不断攀升的要求。Achronix的Speedcore eFPGA是基于经过验证的技术,并可为设计人员提供一条途径,去实现更快速、更小巧的、成本更低且更节能的解决方案,从而支持设计人员根据快速升级的市场需求继续增加他们的计算能力。
Achronix半导体公司是一家提供高性能,高密度FPGA方案的美国高科技公司。Achronix半导体公司跟Intel的合作让其可以用业界最先进的22nm 3D FinFET 技术发展新一代的FPGA器件。