瞄准异构计算前景,加速云推出全球首张Stratix10加速卡
扫描二维码
随时随地手机看文章
“我们是一家纯技术推导出来的公司。”加速云CEO邬钢在此次发布会上多次强调这一点。而一家技术推导出来的公司都有什么特点呢?从邬刚的分享中可以看出来,加速云非常清楚自己要做什么,而且毫不张扬,脚踏实地。在近日北京召开的新品发布会上,加速云一举发布了多款硬件产品和IP。让我们一起来了解一下。
瞄准异构计算前景
“2014年按照英特尔的发展,下一步一定是异构计算。”邬刚分享到,“英特尔早先曾在工业领域推出过X86+FPGA的方案,但是并没有推开。”邬刚早就洞察到,英特尔将会在异构计算方面投入更多,而我们都知道FPGA的门槛较高,因此生态的建设尤为重要。尤其是在很多应用领域的工程师,并不十分清楚FPGA需要如何进行开发。在2015年的IDF大会上,英特尔宣布将推出一款X86+FPGA的处理器,这时候邬刚认为时机到了,因此开始全力着手进行这方面的开发。
如果你仅从名字上来判断,可能会觉得这是一家专门搞云服务的公司。其实不然,加速云应该说是一家拥有很多IP的硬件公司。邬刚先生表示,在国内这种环境下,单纯做IP并不容易,需要与硬件进行绑定。在加速云的团队里面,既要有很强的算法能力,又要有非常强的工程化的能力。这也是加速云与其它公司相比比较特殊的一点。
在此次发布会上,加速云是首次面向媒体发声,一举推出了两大系列的硬件加速产品(SC-OPS,SC-VPX),两个IP库(FDNN,FBLAS)和三大解决方案(深度学习解决方案、高性能计算及数字信号处理解决方案、边缘计算解决方案),下面笔者来给大家简单介绍一番。
全球首张Stratix10加速卡和VPX刀片加速平台
SC-OPS是加速云推出的一款FPGA加速卡,同时这也是世界上第一款使用了14nm工艺Stratix10的加速卡。据邬刚介绍,加速云属于英特尔TOP 10的支持客户之一,因此可以在Stratix10刚流片时候就可以拿到芯片开始进行设计,这也是其竞争力之一。
SC-OPS集成2753K LE资源和9.2T FLOPS单精度浮点计算能力。单板支持2个40G光口或者电口,支持板间通讯以及设备间级联;板载8个DDR4通道, 支持高带宽和大容量的存储访问。
VPX加速系统是一个定制的专用系统。VPX是一个标准,在整个系统中有主控和业务卡。主控主要用来做配置管理和通信用,业务卡来做数据处理。VPX主要定位于数字信号处理和高性能计算领域。据邬刚介绍,这一张卡最多可以有两个Stratix10,有可以插5张卡的和插10张卡的机框;加速云曾经做过一台可以插16张OPS卡的超算去换天河,比例非常可观。
据悉,VPX单板支持24个200维双精度线性方程求解,相当于360台至强服务器,一个6U整机相当于3600台至强服务器。
深度学习加速库FDNN和高性能计算加速库FBLAS
"硬件是载体,IP才是核心。FPGA是一张白纸,有了IP,你可以把它画成清明上河图或者其它。“邬刚如是来形容IP的重要性。
深度学习加速库FDNN是国内首个支持通用卷积神经网络的FPGA加速库,基于RTL级代码,可以提供很高的性能和灵活配置特性。如果把FDNN单独开片的话可以看作是一个类似于谷歌TPU的东西。高性能计算加速库FBLAS是业界更高性能的RTL级数学加速库。
据邬刚介绍,FPGA原厂对于特定行业的理解并没有那么深刻,而特定行业的开发者对于FPGA的应用也有一定困难。对于半导体厂商来讲,也不是每个行业都很懂,也不可能投入那么多的工程师。比如专门设置一个团队搞深度学习,这个不现实。因此原厂更希望提供一些基础的东西,然后找一个第三方来帮他们把行业内的IP都做好,加速云就是它的第三方。加速云做的IP比普通的IP层次还要高一些,普通的IP比如做一个DDS,做一个接口,做一个协议。加速云的IP是基于行业特点开发而来,可以让大家在FPGA的开发上更加易用。
在异构计算领域,加速云走的很快,而且脚踏实地。异构计算的前景已经得到了业界的普遍认可,目前加速云已经积累了很多专用的IP,如果有来者想要赶超,必要要搭上时间再开发一遍。邬刚表示:“想干这件事,先花两年把IP做出来再说,我都已经花了两年做完了,这就是门槛。”