阿里推自研AI芯片背后:打造了更强大的阿里云平台
扫描二维码
随时随地手机看文章
“我手里的这款芯片真的很大,性能非常好。”
9月25日,阿里云智能总裁张建锋在2019杭州云栖大会上发布AI芯片——含光800。这是阿里巴巴第一次用了自己的硬件架构,集成了阿里算法到芯片里面去,也是互联网公司研发的第一款大的芯片。
过去半年,平头哥先后发布玄铁910、无剑SoC平台,随着含光800的发布,平头哥端云一体产品系列初步成型。这款性能强大的云端AI芯片通过阿里云对外输出,无疑将进一步提升阿里云的行业竞争力。
含光800绽放光芒
含光,古代上品名剑。该剑含而不露,光而不耀,平头哥以此名来象征“含光800”带来的无形却强劲的算力。
作为阿里巴巴第一颗自研AI芯片,含光800绽放出全球性能最强的AI芯片“光芒”。在业界标准的ResNet-50测试中,“含光800”推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500IPS/W,是第二名的3.3倍。
而在实际应用场景中,“含光800”已经在发挥效能。在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,而使用“含光800”仅需4颗,延时降至150ms。也就是说,1颗“含光800”的算力相当于10颗GPU。拍立淘每天处理超过10亿张图片,通过AI识别建立索引,以前要耗时1个小时和大量服务器,但现在只要5分钟,效率提升12倍。
可以说,在上述典型的需要极大计算量的关键场景,含光800芯片的首次亮相着实令人震撼。
让阿里云更强大
在中国市场上阿里云可谓是绝对的领头羊。根据最新的行业研究报告,阿里云在中国云计算市场的份额接近50%。
而随着大数据、5G、AIoT驱动,云计算已然进入深水区,竞争压力进一步加大,深耕的阿里云需要不断自我革新和进化,其在众多领域也祭出第二场战事该有的核心武器,如神龙架构、AI芯片等。
含光800芯片并不对外出售,而是通过阿里云以云服务的模式服务外部客户。可以说,它成为阿里巴巴不断打造更强大云平台的有力“支点”。
目前人工智能发展迅猛,含光800芯片的强势发布,将大幅提升阿里云平台对于AI工作流的处理性能,同时大幅下降芯片采购支出。两者有望形成飞轮效应,从而大幅提升阿里云的竞争力。
何以做好AI芯片?
阿里作为全球最大的AI应用者之一,丰富的场景为研发AI芯片提供了绝佳平台,做AI芯片既顺理成章又水到渠成。这不仅可降低阿里巴巴经济体整体计算的成本,还可以云服务的方式交付,以更高的性能和更低的成本赋能更多的企业。
可以说,在发布含光800以后,阿里实现了芯片设计链路的全覆盖,端云一体的全栈芯片生态已然成型。一颗AI芯片背后,成就的是更强大的阿里云蓝图。
事实上,做芯片最难的并不是技术,最终的比拼仍然落在一个关键词——生态上。毕竟,芯片、AI 和云计算之间相互融合、协调发展是大势所趋。
AI算法逐渐集成到芯片,集成算法的专用芯片为云服务提供了更强的性能,而云计算本身则加速了AI应用的大规模落地。这形成了一个良性的闭环。
如果没有云,直接做芯片只会陷入叫好不叫座。而如果没有自身场景的落地扶持,就无法持续优化和迭代,在被公认为周期长投入大门槛高风险大的芯片产业,无法得到足够的长久支撑。最后的难点,才是做芯片的技术。
行业呈现软硬一体化趋势
目前云已经成为数字经济的基础设施,而要广泛地支撑全社会数字转型,需要云计算服务做到有规模、成本低,并且使用上高效便利。
据行业人士介绍,云厂商通过自研AI芯片替换GPU,成本至少可以降低30%以上。这也是促使云厂商亲自“下场”做芯片的一个重要初衷。
目前市场上的CPUGPU并非最佳的训练、推断芯片,或成本较高、或场景的支持效率不高。云厂商清晰地知道,GPU并不是专门为AI算法设计的,它只是碰巧也能适应部分AI算法而已。在研发满足AI算法的芯片上,所有厂商都站在同一起跑线上。
因此过去几年,我们看到谷歌、亚马逊AWS、阿里巴巴等大型云厂商都在发力AI芯片。这种前仆后继背后,不仅是打破云厂商业务边界的试探,更是在云计算的上升势头中不断尝试和定义产业的未来。
行业分析人士认为,这一轮的AI芯片竞赛非常重要。一旦AWS、阿里巴巴等云厂商打赢了这场局部战役,未来也一定会在其他的细分市场进行尝试,一点点蚕食通用计算芯片的份额。长远看,这可能改写整个计算的市场格局。