实现中国车规级AI芯片量的产零突破!地平线推出征程二代
扫描二维码
随时随地手机看文章
人工智能?自动驾驶?听着就让“芯片”觉得压力山大,在对算力的双重超高要求下,如何推出一款面向复杂场景的车载AI芯片是一道业界难题。
车规级AI芯片有多难做?
首先,对于自动驾驶芯片而言,毫秒级的低延迟是安全之根本。自动驾驶技术虽然有望减少96%的车祸率,但这是以芯片拥有超低延迟为前提的。
其次,自动驾驶技术带来的海量计算,对芯片的功耗提出了极致要求。在车载环境下的数据吞吐量非常巨大,一辆自动驾驶汽车每天能够产生600-1000TB的数据计算,而且未来将成为主流的新能源汽车本身也是通过电池供能的,在封闭环境中散热很困难。所以车载AI芯片需要具备极低功耗的特性。
海量计算还需要更强悍的计算平台资源作为支撑,但这会带来很高的成本。如果芯片的成本能够相对更低,这将为产品的竞争力添砖加瓦。
低延迟、低功耗、低成本,提出要求很简单,怎么去解决就需要设计人员耗费心血了。国内AI 芯片技术公司地平线创始人余凯博士指出,抛开芯片的这些基础特性,首先要闯的一关就是车规级验证。地平线于今(30)日刚刚推出了中国首款车规级AI芯片——征程二代(Journey 2)边缘人工智能视觉芯片。
据了解,车规级质量测试标准(AEC-Q100)需要经过环境压力加速测试、使用寿命模拟测试、封装组装整合测试、电气特性确认测试、瑕疵筛选监控测试和封装凹陷整合测试。
普通的消费类电子产品对环境工作温度的要求是0~85℃,而车规级的要求是-40~125℃;前者的最大缺陷故障率为0.03%,而车规级要做到硬件故障率为0。
车规级芯片产品的开发周期长、难度大,是硬科技的比拼和长跑道的创新。余凯表示,车规级就意味着极高的安全性、可靠性和稳定性要求。在车载半导体领域,跑在前面的公司就会一直跑在前面,因为这样的公司拥有非凡的、超常的技术壁垒。
全面优化的征程二代
“我们的企业文化就是:耐得寂寞。”余凯在谈到车规级产品的开发时说道。
据余凯介绍,地平线的征程二代已经通过了AEC-Q100测试标准,该芯片采用台积电的28nm HPC+工艺制造,搭载地平线自主创新研发的高性能计算架构BPU2.0(Brain Processing Unit),可提供超过4 TOPS的等效算力,更重要的是典型功耗只有2瓦。
具体来说,征程二代还具有以下四大极致效能:
极高的算力利用率:典型算法模型的算力利用率大于90%。
极高的算力有效性:配合高效的算法,每TOPS 算力可以处理的帧数可达同等算力GPU的10倍以上。
出色的感知可靠性:典型目标的识别精度超过99%,延迟小于100毫秒。
卓越的感知丰富性:可以识别超过60个类别的目标,每秒目标识别数量超过2000个。
关于征程二代为何效能如此之高,地平线的联合创始人黄畅向集微网表示,主要得益于地平线首重效能、兼顾灵活的BPU架构。
除了BPU,地平线还重新定义了AI处理器性能的评估方式,经典的芯片性能评估方式是PPA,包括Power(功耗)、Performance(性能)和Aera(面积),传统AI芯片真实性能往往通过TOPS/Watt(能效比)和TOPS/$(性价比)来体现。
但黄畅指出,真正的AI芯片性能还包括算法处理速度和精度,算力的利用率以及算力转化为AI性能的效率等。随着算法的演进,趋势是用更少的计算次数达到更高的AI性能,征程二代芯片对于典型、高效、先进的算法可以保持芯片利用率大于90%,而GPU只能做到20~30%。
黄畅强调,全面的优化还要包括编译器和Runtime的优化,以及连接芯片的软件优化,而不仅仅只有算法和芯片的优化。
据介绍,芯片的内部和外部都有存储器。如果使用片外存储器,那么传输带宽仅为10G/s,传输延迟高达100ns,传输功耗大约为640PJ。但是如果使用片内存储,那么传输带宽将达到1000G/s,延迟则低至5ns,传输功耗同样也降低到5PJ。
所以,地平线将数据和计算拆分至合适大小在片上缓存,采用多级并行、数据复用的方式,直接在片内完成,达到降低功耗和提升性能的目的。通过编译器的自动优化,可以将单帧计算延迟降低一半, 单帧带宽也从142MB降低到34MB。
黄畅表示:“地平线的征程二代芯片设计较为激进,这是为了适应未来最主流的算法,让处理器继续高效运行。”
过去、现在和将来
地平线成立于2015年,是台积电全球首个AI芯片客户。2017年,地平线基于人工智能专用计算架构BPU,成功流片量产了中国首款边缘人工智能处理器 “征程”系列处理器和专注于AIoT的“旭日”系列处理器,并已大规模商用。
今年年初,地平线车规级芯片征程二代成功流片后,已在高级别自动驾驶、辅助驾驶(ADAS)、多模交互等方向斩获多达5个国家的客户的前装定点,并有望于明年上半年获得双位数的前装车型定点。
在美、德、中、日全球四大主流汽车市场地平线获得了多家重量级客户的认可,已同包括奥迪、博世、上汽、广汽、长安、比亚迪等国内外顶级Tier 1和汽车厂商,以及禾赛科技、高新兴、首汽约车、SK电讯等科技公司及出行服务商达成战略合作。
基于征程二代,地平线还推出了Matrix二代自动驾驶计算平台及视觉感知方案。相比上一代Matrix,Matrix二代在算力提升高达16倍的同时,功耗仅为原来的2/3,同时可支持高达800万像素的视频输入,行人检测距离高达100米。
伴随着征程二代芯片正式量产,地平线还推出了AI芯片工具链 Horizon OpenExplorer(地平线“天工开物”)。Horizon OpenExplorer 包含面向实际场景进行AI算法和应用开发的全套工具。
关于未来,地平线上海芯片研发中心总经理吴征透露,搭载BPU3.0的征程三代芯片将于明年正式推出,该芯片将符合AEC-Q100和ISO 26262车规级标准。届时,基于该芯片的新一代Matrix自动驾驶计算平台算力将高达192TOPS(特斯拉最新自动驾驶平台为144TOPS)。
地平线副总裁 & 智能驾驶产品线总经理张玉峰则兴奋的表示,征程芯片两年内将有百万量级的前装装车量,五年内有望完成千万量级的目标。
众所周知,车载AI芯片是自动驾驶实现大规模落地的前提,但它也是人工智能行业的珠穆朗玛峰。此次地平线率先推出首款车规级AI芯片不仅实现了中国车规级AI芯片量产零的突破,也补齐了国内自动驾驶产业生态建设的关键环节。
余凯博士表示:“未来,地平线将持续发挥AI时代底层赋能者的核心优势,秉持开放赋能的心态,助推自动驾驶时代早日到来。”