怎么让FPGA产生“质变”?
扫描二维码
随时随地手机看文章
到2020年,将有500万台终端实现联网。每个终端将会源源不断地产生数据,这些数据汇聚起来就是海量的数据。除了物联网,还有机器人、5G通信、人工智能等,对芯片数据处理能力提出巨大的需求:强大的运算能力,更快的计算速度,更小的延时,同时还要保持低功耗等等。
面对计算需求的指数级增长,当前业界出现多种不同的FPGA解决路径;在满足数据时代需求的同时,也推动了FPGA的焕发新生。
01【英特尔】推出CPU+FPGA异构组合架构 针对传统应用和新应用
面对需求挑战,英特尔在平台架构上进行了创新,推出CPU+FPGA(+专用加速器ASSP和ASIC等)的异构组合架构。在这个异构组合架构中,英特尔表示,FGPA在其中扮演着加速器的角色。
其中,FPGA在异构计算中有两种加速形式,一是旁路加速,可以将重度计算功能转移到FPGA上,从而释放处理器去处理其他功能;二是内建加速。如果时延比较重要,则可以进行内建加速,从而通过FPGA的多功能性带来更好的存储和计算的加速。
英特尔的FPGA解决方案针对传统应用和新应用,比如在无人机、传感器融合、机器学习、高性能计算、数据分析等领域。
目前,英特尔最新的Stratix 10高端芯片已经有样片,Arria 10产品已经在全面生产,而Cyclone 10和Max 10已可大量出货。而英特尔下一代 FPGA——Falcon Mesa也将问世,Falcon Mesa是 Altera 并入之后第一代使用了英特尔10nm制程的FPGA。新产品会支持下一代HBM,转换速率达112Gbps,还支持PCIe 4x16,意味着支持的带宽能够达到16TB。
英特尔FPGA上的根基源于当年收购Altera,加上自身的代工实力,实现了FPGA方面的大跨越。
02【Efinix】FPGA布线方面革新 满足传统应用和新应用
Efinix公司在布线方面实现FPGA的革新,颠覆了过去FPGA的基本架构。即,抛弃具有专用功能的每个电路板格的基础上,每一个电路板格都可以根据特定目的被编程。通过布线上的突破,可使芯片尺寸缩小75%,而且能耗只有传统芯片的一半,结构比以往更简单。
在应用上,Efinix的FPGA方案适用于传统应用和新兴应用。包括工业、医学、广播等传统应用,以及IoT 、移动终端、无人机、自动驾驶汽车、边缘计算等新兴应用。
据半导体行业观察的分析,在与传统FPGA的关系上,从产品技术应用上看,Efinix的Quantum FPGA将有可能替代传统FPGA,在设计验证和异构计算等场合得到应用。在异构计算领域,由于Quantum FPGA在性能上比传统FPGA有不少优势,因此可望能实现基于FPGA的异构计算方案的进一步普及。
在解决方案上,Efinix的Quantum FPGA与英特尔的方杂是不同的解决路径,没有直接的可比性。不过,在市场上将会有重叠部分,今后两家公司在抢占市场上将有可能形成竞争关系。
除了传统FPGA的市场之外,Efinix在嵌入式FPGA市场也有布局。而目前在嵌入式FPGA市场,已有一匹黑马ACHRONIX公司,该公司已推出相关解决方案,已收到市场很好的客户反馈,并进一步推出新的eFPGA解决方案。(下一环节重点分析这家公司在嵌入式FPGA中方案)
03【Achronix】嵌入式FPGA市场的黑马 定制单元块实现性能、芯片面积和功耗的优化
嵌入式FPGA(eFPGA)IP产品可以被嵌入到一款ASIC或者SoC之中,从而实现ASIC或SOC灵活的工作方式。
在嵌入式FPGA领域,近期有了新的技术推进。Achronix公司通过定制单元块,可使客户获得ASIC级的效率并同时保持FPGA的灵活性,从而带来了一种可以将功耗和面积降至最低、同时将数据流通量最大化的高效实现方式。
Achronix是一家采用无晶圆厂模式的半导体公司,总部位于美国加利福尼亚州圣克拉拉市。该公司开发了自己的FPGA技术,该技术是Speedster22i FPGA及Speedcore eFPGA产品的基础。在2017年Achronix销售收入增长7倍。其中Speedcore是Achronix增速最快的产品,2015年,Speedcore开始参与客户项目评估;2016年第三季度实现了向首批客户供货。其集成电路工艺技术采用TSMC16nm已量产,采用TSMC 7nm的产品将在2018年上半年完成测试芯片和首批设计。
Speedcore eFPGA提供了性能极高而成本极低的硬件加速,而现在借助Speedcore custom blocks定制单元模块,可以面向最高性能和最小片芯面积这些目标进行优化。从以下案例可以了解详情:
1. 通过为矩阵乘法运算优化数字信号处理器(DSP)和存储单元块,基于卷积神经网络(CNN)的YOLO目标识别算法的芯片面积被缩减了超过40%。
2. 如果用Speedcore custom blocks定制单元块来实现,需要并行比较器阵列的大型字符串搜索功能的片芯面积可以缩减超过90%。
3. 桶形移位器(Barrel shifter)和二进制位处理结构也可以在Speedcore custom blocks定制单元块中完全实现,从而在同样的面积中实现更大的、更精妙的应用,提升了可获得的频率。
4. 一个运行在800MHz的400Gbps包处理数据通道的核心功能也可以用Speedcore custom blocks定制单元块来实现,其可编程逻辑管理分析和控制功能。今天的FPGA独立芯片不能为包处理应用提供这么高的数据吞吐量。
在应用方面,Achronix市场营销副总裁Steve Mensor指出,Achroni嵌入式FPGA主要应用在可加速数据密集的人工智能(AI)/机器学习、5G移动通信、汽车先进驾驶员辅助系统(ADAS)、数据中心和网络应用等新应用领域中。
在与传统FPGA的关系中,“eFPGA解决方案不会替代传统FPGA,两者之前将是一种互补的关系。” Steve Mensor表示。