寒武纪推出新一代云端AI芯片“思元270”
扫描二维码
随时随地手机看文章
寒武纪于 2019 年 6 月 20 日宣布,推出云端 AI 芯片中文品牌“思元”、第二代云端 AI 芯片思元 270(MLU270)及板卡产品。
寒武纪曾于去年正式推出云端 AI 芯片品牌“ MLU”(Machine Learning Unit),此次推出中文品牌“思元”是对 MLU 品牌的有机补充,其含义为“思考的基本单元”。
最新发布的思元 270 芯片集成了寒武纪在处理器架构领域的一系列创新性技术,处理非稀疏深度学习模型的理论峰值性能提升至上一代 MLU100 的 4 倍,达到 128TOPS(INT8);同时兼容 INT4 和 INT16 运算,理论峰值分别达到256TOPS 和 64TOPS;支持浮点运算和混合精度运算。思元 270 采用寒武纪公司自主研发的 MLUv02 指令集,可支持视觉、语音、自然语言处理以及传统机器学习等高度多样化的人工智能应用,更为视觉应用集成了充裕的视频和图像编解码硬件单元。
寒武纪在定点训练领域已实现关键性突破,思元 270 训练版板卡将可通过 8 位或 16 位定点运算提供卓越的人工智能训练性能,该技术有望成为AI芯片发展的重要里程碑。在系统软件和工具链方面,思元 270 继续支持寒武纪 Neuware 软件工具链,支持业内各主流编程框架。此外,为方便开发者更好地挖掘思元270 超强的运算能力、开拓更多的应用领域,寒武纪将在近期向社区和开发者开放专用编程语言。
图丨思元270板卡(来源:寒武纪)
思元 270 芯片采用 TSMC 16nm 工艺制造,其板卡产品可以通过 PCIe 接口快速部署在服务器和工作站内。寒武纪本次公开的思元 270 板卡产品面向人工智能推断任务,在 ResNet50 上推理性能超过 10000fps。MLU270-S4 型板卡(半高半长)面向数据中心部署,集成16GB DDR4 内存,支持ECC;MLU270-F4 型板卡(全高全长)采用主动散热设计,面向非数据中心部署场景,集成 16GB DDR4 内存,支持 ECC。面向人工智能训练任务的思元 270 训练版板卡产品将于本年度第四季度推出。
寒武纪第一代云端 AI 芯片 MLU100 及板卡于 2018 年 5月发布。经过在一年的适配和部署,MLU100 系列产品已为客户在智能视频分析、语音合成、推荐引擎、AI 云等多个领域提供了高能效比的解决方案。思元 270 的发布,将进一步完善寒武纪端云一体产品体系,继续为客户提供性能卓越、高度优化的人工智能算力支撑。
寒武纪 CEO 陈天石表示:“寒武纪始终致力于为合作伙伴提供性能卓越、高度灵活的人工智能芯片。最新推出的思元 270 芯片和板卡产品将为客户带来速度更快、功耗更低、性价比更高的 AI 加速解决方案。作为人工智能芯片的先行者和引领者之一,寒武纪将持续推动该领域的技术和产品创新,为全球人工智能产业注入新鲜的血液,带来全新的动力。”