RISC-V+AI将成为撼动CUDA生态的一股力量
扫描二维码
随时随地手机看文章
在万物智联的时代,RISC-V与人工智能(AI)的结合正在为未来的计算领域开辟新的道路。尽管近年来中国的AI芯片在性能上取得了显著进步,但与国际领先的英伟达相比,国内在软件生态方面仍存在较大差距。英伟达的CUDA生态自2006年推出以来,已经发展出超过450万的开发者,这一庞大的生态系统成为其在AI领域占据主导地位的关键因素。而RISC-V+AI的结合,有望成为撼动CUDA生态的一股力量。
北京大学讲席教授兼RISC-V国际基金会人工智能与机器学习专委会主席谢涛教授,在第四届滴水湖中国RISC-V产业论坛上受邀探讨了这一前沿主题。
国外AI算力软件生态壁垒高筑
面对国外AI算力软件生态壁垒高筑的这一挑战,许多国内AI芯片公司选择兼容CUDA生态,以迅速获取市场份额。然而,这种策略尽管可以在短期内奏效,但从长远来看,依然存在受制于人的风险。CUDA的每一次更新,都会推出优化的新API,这些API专为英伟达的新一代芯片设计,使得其它芯片公司难以追赶。此外,依赖开源编译器来规避法律诉讼的策略,也并非长久之计。如果有一天开源编译器无法支持非英伟达的AI芯片,将对这些企业产生重大冲击。
与之相对的是,另一部分AI芯片公司选择自定义编程语言,这种方法尽管增强了自主性,但也带来了巨大的成本和技术壁垒。这些公司需要维护完整的软件工程团队,并投入数十年的研发资源。然而,由于人才稀缺、力量分散,这种策略难以形成与CUDA抗衡的合力。
在这种背景下,RISC-V作为一种开源的CPU指令集架构,逐渐受到关注。RISC-V的开放性和灵活性使得全球的开发者能够共同构建一个不受单一企业控制的生态系统,这一点类似于Android对iOS生态的冲击。RISC-V不仅在AI领域具有巨大潜力,还能够通过其可扩展性和定制化,满足AI工作负载快速变化的需求。
RISC-V+AI的两种主要模式中,紧耦合模式适用于低功耗领域,在这种模式下,RISC-V架构将AI计算单元集成在CPU内部,实现资源共享;而松耦合模式则适用于大算力领域,通过外挂协处理器的方式来执行AI任务,提供更强大的计算能力。
基于RISC-V构建AI算力的优势在于其开放性、可扩展性以及高效的功耗管理。RISC-V架构允许设计者根据具体需求添加自定义指令,从而提升AI计算的性能和效率。此外,RISC-V的简洁设计和定制化扩展能够有效减少数据传输等待时间,提高整体计算效率。同时,RISC-V生态系统的多样性和全球开发者的广泛参与,为其在AI领域的发展提供了强大的推动力。
然而,尽管RISC-V在技术上具备诸多优势,但其生态系统在发展过程中也面临挑战。当前,国内外企业在RISC-V+AI领域的技术方案各不相同,生态系统高度碎片化,缺乏统一的标准和协作。此外,与国际巨头相比,我国在这一领域的资源投入严重不足,组织统筹力度不够,产学研之间的协同也不够紧密。
谢涛表示,为应对这些挑战,未来的整体思路应是自下而上推进技术标准和开源系统软件栈的建设,以形成“根技术开源”与“叶技术竞争”的生态布局。同时,应聚焦边缘计算与终端侧的应用场景,推动软件生态的发展,并通过工具创新,依托RISC-V软硬件生态,积极参与国际开源工具的开发。
在国际舞台上,通过推动RISC-V国际标准的制定,依托上游国际开源社区,中国企业可以迅速布局新时代的新市场,特别是在智能终端和AI PC等领域。此外,共建国际开源软件生态,探索和制定新的标准,如Triton和SYCL,这些新兴技术将为RISC-V生态的发展提供坚实的基础。
Triton和SYCL作为替代CUDA的潜在解决方案,展示了RISC-V在全球范围内构建AI系统的潜力。Triton作为硬件无关的中间层表示,允许各硬件厂商基于Triton进行硬件相关的算子优化,实现对上层AI框架的高效支持。SYCL则作为开放架构的代表,通过社区驱动的发展模式,避免了授权问题,使得技术发展不再被少数公司垄断。
RACE将团结RISC-V生态伙伴,以“粗烟筒式”和GPGPU齐头并进
在未来的发展中,RISC-V+AI的生态系统将通过推动国际标准和共建开源社区的双重手段,逐步壮大并与现有的AI计算生态形成有力的竞争。在这一过程中,中国将发挥关键作用,通过共建、共创,推动RISC-V在全球AI计算领域的广泛应用,助力全球科技的可持续发展。
谢涛表示,RISC-V+AI算力生态委员会(RISC-V+AI Computility Ecosystem, RACE)正在通过执行委员会、秘书处和产业咨询委员会共同推进其工作。秘书处(开芯院)由邵恩和高明晋担任正、副秘书长,负责协助执行委员会的落实施工。产业咨询委员会则在孟建熠的领导下,为决策提供建议。RACE的组织架构还包括专项工作组和项目协调组,两者协同工作推动各项任务的开展。目前,RACE的工作组已有28家企业和16家高校科研院所参与,涵盖了Matrix、Tensor、GPGPU、存算一体、系统软件栈等领域。RACE委员会欢迎更多机构的加入,共同建设RISC-V+AI生态。
而由ASE、PLCT、算能公司联合发起的“甲辰计划”,旨在到2036年(丙辰年)之前,基于RISC-V构建从数据中心到桌面办公、从移动穿戴到智能物联网全信息产业覆盖的开放标准体系及开源系统软件栈,使RISC-V软硬件生态的成熟度达到或超过其他主流架构。该计划的目标包括:联合100家以上处理器及方案厂商、500家以上软件企业,在18个以上关键行业领域完成RISC-V的适配与优化,合作完成超过1000款重要行业及商业软件的移植与部署;围绕SG2380、香山等高性能RISC-V处理器及IP,推动基于RISC-V的行业解决方案在智算加速、边缘计算、存储、机器人、工业仿真、医疗辅助等领域的商业落地;建立RISC-V人才识别体系,连接超过1万名具备RISC-V硬件设计、软件开发、社区运营、教育培训专业人才,实现RISC-V人才领域的互认合作。
这条RISC-V+AI之路,不仅为国内科技企业带来了新的发展机遇,也为全球技术合作开辟了新的空间。在万物智联的时代,RISC-V将以其独特的优势,成为引领未来AI计算的核心力量。
谢涛表示,“RACE也将团结企业一起探索、探讨,也要定出Triton,比CUDA要更高层的生态。英伟达是GPGPU是Triton主要支撑的,所以也给我们一个机会、让RISC-V能够长出一块,团结大家一起‘粗烟囱式’的能够和GPGPU的齐头并进。”