原创

A100/H100 GPU需求激增，传NVIDIA向台积电下“超级急件”

时间：2022-09-26 15:15:01

关键字： NVIDIA 台积电 GPU

手机看文章

扫描二维码
随时随地手机看文章

[导读]传全球GPU龙头英伟达(NVIDIA)为了满足大陆客户激增的需求，近期对台积电下了“超级急件(super hot runs)”订单，计划在美国管制其A100/H100 GPU产品销往大陆的缓冲期之内完成更多的交付。

传全球GPU龙头英伟达(NVIDIA)为了满足大陆客户激增的需求，近期对台积电下了“超级急件(super hot runs)”订单，计划在美国管制其A100/H100 GPU产品销往大陆的缓冲期之内完成更多的交付。

据悉，此次NVIDIA以“超级急件”的方式要求台积电提前生产了原订于明年出货的部分产品，总量约5,000片晶圆，由于是“超级急件”订单，因此交期将大幅缩短，从原本预估的5-6个月，压缩到了2-3个月。预计，这批产品最快10月底至11月初，将有望开始陆续交货。

对此，NVIDIA表示，不评论市场传闻。台积电也拒绝评论单一客户信息。今年8月31日晚间，业内传出消息称，NVIDIA和AMD的面向数据中心的高端GPU对中国大陆的出口已经被美国政府管制。

9月1日早间，NVIDIA确认，已接到美政府通知，未来向中国和俄罗斯出口A100和即将上市的H100芯片将需要新的许可证要求。这些规则也适用于DGX或任何其他包含A100或H100芯片和A10x的系统;这些规则还涵盖任何未来的芯片，其峰值性能和芯片间I/O性能均等于或大于大致等于A100的阈值，以及包括这些电路的任何系统;新规则可能会影响公司及时完成H100开发或支持A100现有客户的能力，并可能要求NVIDIA将某些业务转移到中国境外。

NVIDIA 认为，拥有一种共通的交换格式，将能推动软体与硬体平台的互动，进而加快 AI 运算发展。也因此，NVIDIA、Intel 和 Arm 携手合作，共同撰写 FP8 Formats for Deep Learning 白皮书，透过描述 8 位元浮点运算规格，提供一个共同的交换格式加速 AI 训练、推理。

NVIDIA 进一步解释称，FP8 规范有两个版本，分别是 E5M2 和 E4M3，可最大限度减少与现有的 IEEE 754 浮点格式的偏差，能为 AI 训练、推理发展带来更大的自由度，得以在硬件与软件间取得良好平衡，以改善开发者的生产效率。

根据实验结果，在广泛的训练架构中，像是 Transformer，FP8 训练的准确性都类似 16 位元结果，但却有更好的效能。譬如 NVIDIA Hopper 便利用新的 FP8 格式，在 BERT 高精度模型上实现了 4.5 倍的加速。

黄仁勋、克里斯·马拉科夫斯基和卡蒂斯·普里姆于1993年1月美国加州创办了NVIDIA(随后成为特拉华州企业)。NVIDIA保持低调直到1997-1998年，当时它发布了RIVA个人电脑绘图处理器产品线。它于1999年1月在Nasdaq挂牌上市;同年5月，售出第一千万个绘图处理器。于2000年它收购了一代王者3dfx的知识产权。3dfx是九十年代中期其中一间最大的图形处理器厂商。NVIDIA与很多OEM厂商，和一些组织创建起密切关系。2002年2月，NVIDIA售出第一亿个绘图处理器。

NVIDIA和 AMD供应了市场上大部分独立显卡。NVIDIA最著名的GeForce绘图处理器产品线于1999年首次亮相。GeForce产品线已扩充至覆盖桌面型和流动型电脑。手持式设备方面，NVIDIA拥有Tegra产品线。它能提供高效能同时，亦能保持低电源消耗。此类产品通常用于无线通信设备。

当地时间2022年8月31日，美国半导体公司英伟达(NASDAQ：NVDA)在向美国证券交易委员会(SEC)递交的一份监管文件中披露，美国政府已推出一项新的出口许可管制，将影响到英伟达向中国和俄罗斯出口两款高性能GPU产品。

根据3DCenter的数据显示，今年二季度独立GPU出货的总数量为 1040 万件，销售额约为 55 亿美元。独立显卡的平均售价也从 2021 年第二季度的 1029 美元跌至 2022 年第二季度的 529 美元。下图也展示了NVIDIA在独立GPU市场的领头羊地位。

techspot分析师 Mike Bruzzone还提供了每个供应商的 GPU 市场份额和 GPU 系列市场份额细分数据。据称，供过于求的问题正在成为一个大问题，NVIDIA 可以通过他们的合作伙伴快速转移他们的库存。GPU 供应商目前计划在 9 月提供第二轮降价，这将进一步降低价格。