比特大陆第二代人工智能芯片BM1682能否打破外界质疑?
扫描二维码
随时随地手机看文章
此前,由于IPO的问题,比特大陆的人工智能芯片曾饱受质疑。近日,比特大陆第二代人工智能芯片BM1682,这款产品能否打破外界的非议呢?接下来让我们看看这款产品的细节。
2017年第4季度,比特大陆正式推出了其人工智能品牌算丰(SOPHON),发布了全球首款公开发售的TPU(Tensor Processing Unit张量计算单元)芯片BM1680,专门用于人工智能中的深度学习加速。
时隔不足一年,2018年3月,比特大陆又推出其第二款TPU芯片BM1682,根据初步披露的资料显示,BM1682是一块专门用于图像/视频处理方向的人工智能芯片。
BM1682与BM1680使用了相同的深度学习算法的硬件加速模块,但相比BM1680而言,BM1682具有更强大的深度学习算法执行能力,此外BM1682还增加了视频处理子模块,以及适用于具体应用场景的诸多功能模块。
BM1682定位更细分
从顶层架构图上可以看到,BM1680比BM1682额外集成了高度定制的BMDNN Chip Link Subsystem。该子模块可以在高速SerDes上提供稳定、灵活、低延迟的链路。用户可以通过该链路将多个BM1680芯片连接成一个统一的整体,使其协同工作,大大提高系统的运算能力。
从顶层架构图上可以看到与BM1680相比,BM1682芯片的整体架构发生了不小的变化,其定位则更加细分明确。
BM1682设计更丰富
从架构图看,BM1682明显复杂了很多。其额外增加了AP (Application Processor) Subsystem和Video Subsystem(视频处理系统)。Video Subsystem(视频子系统)则主要专注于视频预处理的相关任务。
BM1682的Video Subsystem提供了2个H.264视频解码器,1个H.265解码器。
比较贴心的是,BM1682提供了Video Post-Processing功能,该子模块用于对采用H.264或H.265编码的视频进行渲染处理,这些渲染处理主要包括颜色空间转换、视频剪裁、缩放操作、仿射变换、多帧拼接等常规操作。经过Video Post-Processing对外界进入的视频数据进行硬件加速预处理后,Video Subsystem会将处理后的数据通过总线传输给NPUs、DRAM、AP System或外接存储设备,然后进行后续的深度学习处理等操作。
此外,BM1682提供了丰富的外界交互接口,如高速接口PCIE、以太网、SDIO3.0、WIFI等。BM1682将数据处理完毕后可以很方便地通过PCIE接口、以太网接口、或者WIFI接口将数据传输到总服务器。
BM1682极大提升
BM1682中每个NPU含有32个EUs,BM1680未知。根据BM1680、BM1682数据手册显示,单片BM1680单精度运算速度为2TFLops;单片BM1682单精度运算速度为3TFLops。BM1682的单片运算速度高出BM1680 50%。
BM1680单片的运行速度低于BM1682,但BM1680支持级联工作模式,数个BM1680可以通过高速的Chip Link Subsystem组成一个集群式的系统,进行更高处理量的运算处理任务。BM1682不具备级联功能。
BM1682更专注图像、视频处理
整个BM1682芯片搭载了视频处理所需要的全部核心模块,以及对其具体应用场景适应性的辅助模块。BM1682对于需要进行图像/视频处理的市场应用可谓是十分便捷了。BM1682的辅助功能配置模块自带有线与无线网络功能,对于视频监控方向的市场应用十分方便,无线功能更是省略了网线布线的繁琐施工,并且可用于实现远程监控。
对于一些没有网络的场合,如科研领域的野外视频收集处理、闭路视频监控等,BM1682可以轻松的添加外置存储装置进行数据备份收集。BM1682作为图像/视频方向深度学习的SoC片上系统,市场前景很是广阔,这款新品还是很值得期待的。
BM1684即将到来
此外,据比特大陆此前透露,BM1680的后续芯片早已开始进入研发阶段,BM1682已经在去年12月成功流片,BM1684将会在2018年的9月完成流片。其中BM1684预计在2018年4季度成功量产,其性能指标将达到6T运算力、30W功耗、同时还支持FP16、INT8等低精度计算。其还将使用TSMC提供的12nm最新工艺。
比特大陆产品战略总监汤炜伟表示,按照规划每隔9个月左右就会推出新的算丰AI芯片,而再过一两代,比特大陆有信心在深度学习推理上超过GPU的实际性能。