性能不及华为还加价!英伟达最新特供AI芯片来了
扫描二维码
随时随地手机看文章
业内知情人士透露,近日英伟达已开始接受经销商预订最新的中国特供(AI)芯片 H20。消息人士称,H20 在某些关键领域的性能不如华为的 AI 芯片昇腾 910B。
报道称,近几周英伟达对中国分销商的定价为一张 H20 芯片 12,000-15,000 美元(当前约合人民币 86,310-107,888 元)。
然而,一些分销商已经开始对英伟达 H20 进行加价宣传,单张 H20 芯片的要价已经上升到了 15,320 美元(当前约合人民币 110,189 元)。相比之下,华为 AI 芯片昇腾 910B 的售价约为人民币 12 万元。
一位消息人士称,经销商正在组装 H20 服务器,该服务器预配置了 8 颗 H20 芯片,一台的售价约为 140 万元人民币。相比之下,一年前同样配置了 8 颗 H800 芯片的服务器售价在 200 万元人民币左右,从价格也能看出其性能 “减配” 的幅度不小。
消息人士还补充说,经销商已通知客户,2024 年第一季度开始小批量交付 H20 产品,第二季度开始大批量交付。
除了 H20 之外,专供中国市场的芯片还有两款(L20 和 L2),H20 是这三款显卡中性能最强的。据了解,这三款芯片原计划于 2023 年 11 月推出,但由于服务器制造商在集成芯片时遇到了问题,所以被推迟到今年了。
从此前曝光的规格来看,H20 的内存容量 96 GB,运行速度 4.0 Tb/s,运算能力为 296 TFLOPs,使用了性能密度仅为 2.9 的 GH100 芯片。相比之下,H100 的运算能力理论上是 H20 的 6.69 倍,以 FP16 Tensor Core 的浮点计算能力(FP16 Tensor Core FLOPs)来看:
H100 SXM TF16(Sparsity)FLOPS = 1979
H20 SXM TF16(Sparsity)FLOPS = 296
而作为海外的版本,基于 Hopper 架构打造的 H200 处理速度 4.8TB/秒,拥有 141GB 的内存,与前代产品相比 H100 容量几乎翻番,而且还与 H100 兼容。
值得一提的是,2023 年 10 月美国出台了新的出口禁令,进一步限制了英伟达高性能 AI 芯片的出口,英伟达当即叫停A100、A800、H100、H800 及 L40S等产品的发货。
无法放弃巨大的中国市场,英伟达不得不再一次推出特(jian)供(pei)芯片以应对美国的出口管制法规。据悉,HGX H20、L20 PCle 和 L2 PCle 三款芯片均基于英伟达 H100 削弱而来,H100 都因为算力太高被禁,这三款自然更低。
在法规限制之前,英伟达占据中国市场的份额已经超过了 90%,然而随着中美科技限制的不断加码,英伟达在中国市场面临着来自华为等本土竞争对手的强烈冲击。
据了解,华为的昇腾 910B 是目前中国市场上最具竞争力的 AI 芯片,而且由于市场担心美国进一步加码限制的原因,该芯片正在变得越来越受市场欢迎。一位业内人士表示,规格上 H20 的 FP32 性能还不到昇腾 910B 的一半。
此前就有爆料称,国内的互联网巨头百度、腾讯、阿里以及字节正逐步将一些先进芯片订单转移给本土公司,并且更多地依赖公司内部开发的芯片。
也有消息人士透露,H20 在互连速度方面似乎比 910B 更具优势,互连速度衡量的是芯片之间数据传输的速度。这意味着在需要将大量芯片连接在一起作为一个系统工作的应用中,H20 仍然比昇腾 910B 具有竞争力。
据报道,首席执行官黄仁勋此前在元旦假期前参观了该公司位于深圳、上海和北京的办公室,并在年会上穿着东北大花扭秧歌,强调了中国市场对英伟达的重要性。
总的来说,尽管面临激烈的竞争和性能上的挑战,英伟达在中国市场的布局仍在继续深化,推出特供版芯片也是战略布局的一部分。无论怎样,拥有更多的选择对中国市场来说总是更好的。
值得一提的是,受人工智能市场乐观预期的影响,2024 年 1 月英伟达市值出现了破纪录飙升,创下有史以来最大月度涨幅(约 2965.2 亿美元),超过了去年 5 月创下的历史高点,目前总市值达到了约 1.52 万亿美元。