当前位置:首页 > 原创 > 刘岩轩
[导读]2024年7月6日下午,由上海开放处理器产业创新中心和芯原微电子(上海)股份有限公司主办的“RISC-V和生成式AI论坛”,在上海世博中心成功召开。芯原股份创始人、董事长兼总裁戴伟民博士发表了关于“AIGC芯片的机遇与挑战”的精彩演讲。这一演讲不仅深入分析了人工智能技术的历史发展和当前趋势,还预测了这些技术将如何在未来塑造半导体行业,特别是在AIGC领域的应用和发展。

2024年7月6日下午,由上海开放处理器产业创新中心和芯原微电子(上海)股份有限公司主办的“RISC-V和生成式AI论坛”,在上海世博中心成功召开。芯原股份创始人、董事长兼总裁戴伟民博士发表了关于“AIGC芯片的机遇与挑战”的精彩演讲。这一演讲不仅深入分析了人工智能技术的历史发展和当前趋势,还预测了这些技术将如何在未来塑造半导体行业,特别是在AIGC领域的应用和发展。


群模乱舞是浪费电,垂直领域微调具备更高价值

戴博士的演讲首先回顾了从机械化时代到信息化时代的转变,强调了人工智能从“弱智能”向“强智能”的转变如何极大地推动了计算需求的增长。他指出,随着技术的进步,AIGC的发展已从单一模式识别和响应,扩展到更复杂的任务如自然语言处理和机器学习模型的自我迭代。这些技术的进步不仅加速了人工智能的应用,也对芯片设计和制造提出了新的要求。

但当下的“百模大战”,在戴博士看来更像是“群模乱舞”、浪费电。“不要说一讲起AI就要建一个训练中心、要很多训练卡,树干是长不出树叶的、要树枝。树枝是什么意思?微调。垂直领域的微调,这是在端上、然后端上再推。实际上三张卡“云上的训练卡、端上的微调推理卡”,应该是端上的卡大大大于“云”上的卡。”戴博士解释到。


AIGC:推动高性能计算芯片市场扩张

戴博士详细探讨了AIGC技术对半导体行业的具体影响。他提到,随着模型规模的增加,对计算能力的需求也呈指数级增长,这直接推动了高性能计算芯片市场的扩张。在他的演讲中,戴博士使用具体数据展示了从GPT-3到GPT-4模型的参数和计算需求的激增,以及这对芯片设计和生产技术的挑战。

据悉,GPT 3拥有1750亿个参数,计算需求 约为 315000百亿亿次;GPT 4约有1.7万亿个参数,计算需求 约为 1.35亿百亿亿次。一个拥有10万亿参数的理论上要130亿百亿亿次的计算量,将需要1060万个A100 PCle 80GB芯片或3336 个采用256 个Grace Hopper芯片的DGX GH200系统。

而为了实现这些模型加速,产业界也进行了多种探索。Groq自研的一种名为张量流处理器(TSP)的新型处理单元,并定义为“语言处理单元 (LPU)”。通过其专门的架构设计、高效的内存带宽、改进的能效比、可扩展性和未来发展潜力,在处理 特定AI工作负载,尤其是大型语言模型时,相对于GPU展现出显著的先进性。

初创公司Etched AI,则针对Transformer推出了专用ASIC“Sohu”。Sohu是基于台积电4nm工艺,配有144GB HBM3E高带宽内存。能效方面明显优于传统GPU,推理方面性能比英伟达的H100快20倍。而这种性能优势的建立是基于对Transformer架构的优化硬化,所以并不能够支持CNN、RNN 或 LSTM等大多数AI 架构,灵活性欠佳。

戴博士引用了来自Counterpoint Research的数据,该报告称到2030年,关键计算领域的半导体收入将达数万亿美元;,生成式AI将使服务器领域的半导体收入增至三倍,达到5930亿美元的规模。


下一轮“先软后硬”的牛市正在到来,芯原实现积极布局

芯原在应对AIGC挑战方面的创新举措,包括低功耗设计、高性能计算和芯片微调技术上的突破。特别是在可穿戴设备和汽车电子领域,芯原开发的芯片不仅能够处理复杂的AI模型,还能在极低的功耗下运行,这些技术的应用展示了其在行业中的领先地位。

在今年的德国嵌入式展上,芯原还展示了谷歌Open Se Cura项目。这是一个由设计工具和IP库组成的开源框架,旨在加速安全、可扩展、透明和 高效的AI系统的发展;芯原提供多个IP、低功耗芯片设计、BSP,并负责推动该项目的商业化。

值得一提的是,芯原神经网络处理器 (NPU) 已在全球累积出货超过1亿颗,被72家客户用于其128款人工智能芯片中,涉猎了超过10个市场应用领域。芯原的图形处理器 (GPU) 也已在全球累积出货近20亿颗,拥有70项专利,在千万辆车上运行。在视频处理器 (VPU) 方面,芯原也是全球第一。其VPU产品已被全球前20大云平台解决方案提供商中12个采用,国内前5大互联网提供商种有3个也选择了芯原的VPU。

在自动驾驶方面,芯原Chiplet技术正在助力构建下一代智慧驾驶平台。在数据中心领域,芯原也提供了全面的产品组合,提供了一系列高性能AIGC芯片。

展望未来,戴博士讨论了AIGC技术在多个垂直市场中的应用前景,如自动驾驶、健康医疗和制造业等。他预测,随着技术的成熟,这些领域的需求将进一步驱动高性能芯片的市场增长。此外,他强调了在全球范围内建立战略合作伙伴关系的重要性,以便更好地利用全球资源和专业知识,加速AIGC技术的商业化进程。

“我认为下一轮牛市2026年、最晚2027年,是因为2023年的ChatGPT。”戴博士认为,上一轮的牛市由iphone4开启,是从移动硬件创新到移动互联网的软件创新,“先硬后软”的节奏。而新一轮的牛市的开启,则是先软后硬的节奏,以ChatGPT为代表的大模型将会引领大算力硬件的“牛市”。


结语

戴伟民博士的演讲为我们提供了对AIGC技术发展的深刻洞察,以及这些技术如何影响芯片行业的全面分析。他的见解不仅强调了芯原在这一变革中的领导角色,也展示了半导体行业面临的机遇与挑战。随着AI技术的快速进步,芯原的创新和战略布局将在未来的技术革命中扮演关键角色,推动整个行业向前发展。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭