A100/H100 GPU需求激增,传NVIDIA向台积电下“超级急件”
扫描二维码
随时随地手机看文章
传全球GPU龙头英伟达(NVIDIA)为了满足大陆客户激增的需求,近期对台积电下了“超级急件(super hot runs)”订单,计划在美国管制其A100/H100 GPU产品销往大陆的缓冲期之内完成更多的交付。
据悉,此次NVIDIA以“超级急件”的方式要求台积电提前生产了原订于明年出货的部分产品,总量约5,000片晶圆,由于是“超级急件”订单,因此交期将大幅缩短,从原本预估的5-6个月,压缩到了2-3个月。预计,这批产品最快10月底至11月初,将有望开始陆续交货。
对此,NVIDIA表示,不评论市场传闻。台积电也拒绝评论单一客户信息。今年8月31日晚间,业内传出消息称,NVIDIA和AMD的面向数据中心的高端GPU对中国大陆的出口已经被美国政府管制。
9月1日早间,NVIDIA确认,已接到美政府通知,未来向中国和俄罗斯出口A100和即将上市的H100芯片将需要新的许可证要求。这些规则也适用于DGX或任何其他包含A100或H100芯片和A10x的系统;这些规则还涵盖任何未来的芯片,其峰值性能和芯片间I/O性能均等于或大于大致等于A100的阈值,以及包括这些电路的任何系统;新规则可能会影响公司及时完成H100开发或支持A100现有客户的能力,并可能要求NVIDIA将某些业务转移到中国境外。
NVIDIA 认为,拥有一种共通的交换格式,将能推动软体与硬体平台的互动,进而加快 AI 运算发展。也因此,NVIDIA、Intel 和 Arm 携手合作,共同撰写 FP8 Formats for Deep Learning 白皮书,透过描述 8 位元浮点运算规格,提供一个共同的交换格式加速 AI 训练、推理。
NVIDIA 进一步解释称,FP8 规范有两个版本,分别是 E5M2 和 E4M3,可最大限度减少与现有的 IEEE 754 浮点格式的偏差,能为 AI 训练、推理发展带来更大的自由度,得以在硬件与软件间取得良好平衡,以改善开发者的生产效率。
根据实验结果,在广泛的训练架构中,像是 Transformer,FP8 训练的准确性都类似 16 位元结果,但却有更好的效能。譬如 NVIDIA Hopper 便利用新的 FP8 格式,在 BERT 高精度模型上实现了 4.5 倍的加速。
黄仁勋、克里斯·马拉科夫斯基和卡蒂斯·普里姆于1993年1月美国加州创办了NVIDIA(随后成为特拉华州企业)。NVIDIA保持低调直到1997-1998年,当时它发布了RIVA个人电脑绘图处理器产品线。它于1999年1月在Nasdaq挂牌上市;同年5月,售出第一千万个绘图处理器。于2000年它收购了一代王者3dfx的知识产权。3dfx是九十年代中期其中一间最大的图形处理器厂商。NVIDIA与很多OEM厂商,和一些组织创建起密切关系。2002年2月,NVIDIA售出第一亿个绘图处理器。
NVIDIA和 AMD供应了市场上大部分独立显卡。NVIDIA最著名的GeForce绘图处理器产品线于1999年首次亮相。GeForce产品线已扩充至覆盖桌面型和流动型电脑。手持式设备方面,NVIDIA拥有Tegra产品线。它能提供高效能同时,亦能保持低电源消耗。此类产品通常用于无线通信设备。
当地时间2022年8月31日,美国半导体公司英伟达(NASDAQ:NVDA)在向美国证券交易委员会(SEC)递交的一份监管文件中披露,美国政府已推出一项新的出口许可管制,将影响到英伟达向中国和俄罗斯出口两款高性能GPU产品。
根据3DCenter的数据显示,今年二季度独立GPU出货的总数量为 1040 万件,销售额约为 55 亿美元。独立显卡的平均售价也从 2021 年第二季度的 1029 美元跌至 2022 年第二季度的 529 美元。下图也展示了NVIDIA在独立GPU市场的领头羊地位。
techspot分析师 Mike Bruzzone还提供了每个供应商的 GPU 市场份额和 GPU 系列市场份额细分数据。据称,供过于求的问题正在成为一个大问题,NVIDIA 可以通过他们的合作伙伴快速转移他们的库存。GPU 供应商目前计划在 9 月提供第二轮降价,这将进一步降低价格。