NetSpeed 发布基于人工智能的片内互连方案Orion AI 重新定义SoC设计
扫描二维码
随时随地手机看文章
2017年底的美国NIPS大会上,特斯拉宣布了正在研制AI芯片的大消息,这是以4级和5级自动驾驶为目标的前瞻性设计。
4级自动驾驶将需要非常巨大的计算和数据传输需求,英特尔的报告指出,其的计算量高达到4TB/天。目前,特斯拉的自动驾驶系统Autopilot采用英伟达的GPU方案。然而GPU计算能力的进一步提升带来的巨大功耗不容忽视,很难同时满足未来无人驾驶要求的巨大运算能力和超低功耗。4级自动驾驶未来采用更具功耗优势的AI芯片则是势在必行。
据悉,特斯拉这款自研AI芯片已经进入测试阶段。和同类芯片相比,其开发周期大大缩短,仅仅9个月。这是因为该芯片在设计初期就采用了颠覆性的设计思路,芯片内部通信采用了NetSpeed Systems公司基于人工智能的拓扑结构。
无独有偶,高通、Intel、亚马逊,以及中国的AI领军企业百度、寒武纪和地平线机器人也采用了这种创新的片内互连方案。为什么这一设计理念会受到众多AI公司的青睐?NetSpeed Systems大中华区销售总监黄啓弘向21ic记者介绍了最新发布的SoC片内互连方案Orion AI及其优势。
图:NetSpeed Systems大中华区销售总监黄啓弘
人工智能技术在视频、语音、预测、机器人及自动驾驶等应用中越来越广泛。黄啓弘表示,
这些热门的AI应用已经对处理能力提出进阶需求,需要TB/s量级的带宽。芯片内部上千个运算单元,会达到甚者超过512位的位宽,这些对工程师设计SoC架构带来了巨大的挑战。这时候,就需要打破传统的设计思路,借助人工智能算法帮助工程师化繁为简。
Orion AI片内互连方案应运而生。Orion AI基于NetSpeed经过验证的Orion IP,提供了以人工智能为核心的设计方法,在芯片内部采用点对点通信,通过大型矩阵乘法,帮助工程师寻找到最佳解决方案,显著节省了开发时间。“在SoC架构设计的最初,工程师就可以把系统需求提供给Orion AI,NetSpeed的图灵机器学习引擎将通过神经网路进行多次的学习迭代,不断优化,最终得到符合系统需求的最佳设计。”黄啓弘表示,“工程师们不必再为思考系统内部数据交换的主从关系等耗费大量宝贵的时间,而能用更多的精力进行创新设计。如果系统需求要更改或进一步提升,Orion AI也可以提供持续的设计反馈。”
图:Orion AI在神经网络上多次迭代得到最佳方案
基于人工智能的设计需要大量的计算单元,任意节点数据点对点的通信也需要极高的带宽,这时候,Orion AI支持可配置多播的专利技术和先进的QoS机制就显得至关重要。Orion AI可以动态控制下一点到多点的传播,而且支持无需回传的写入信息模式,大大提高了效率。同时,Orion AI先进的端到端带宽分配控制和通信隔离与延迟控制机制使QoS得到保障。
图:Orion AI具有模块化、可扩展的多层堆叠架构
据介绍,Orion AI可实现极致性能,片上带宽高达万亿位,并具备支持数千计算引擎的底层架构。它提供超宽数据通路,接口位宽高达1024位,内部结构位宽更高,并可支持高达4K字节的长突发传输。NetSpeed近日推出的SoCBuilder包含一个预集成的第三方IP目录,以及针对人工智能、汽车电子、5G、超大规模计算和AR / VR等应用的专用参考设计。采用SoCBuilder,SoC开发将更快速、更容易,更准确,将系统搭建时间从数月或数周缩短到数天。
正如Linley Group首席分析师Linley Gwennap所说,有了Orion AI的帮助,“就像有一位随时在线的建筑大师给出设计建议。”Orion AI 重新定义了SoC设计,使得SoC既面向人工智能应用,本身也运用人工智能技术,工程师可以采纳图灵的建议得到最优架构,用宝贵的时间去解决SoC设计中的其他难题。