携手竞争对手,NVIDIA携手Intel和Arm发布FP8标准,提升AI运算速度和效率
扫描二维码
随时随地手机看文章
为了加速 AI 训练、推理的发展,英伟达(NVIDIA)、英特尔(Intel)以及 Arm 近日携手发布了“FP8 Formats for Deep Learning”白皮书,希望能通过 8 位浮点运算的格式来改善运算性能,并将其作为 AI 通用的交换格式,提升深度学习训练与推理速度。目前该白皮书也已提交给了电气与电子工程师协会(Institute of Electrical and Electronics Engineers, IEEE)。
FP8 格式之所以重要的原因有很多,其中最重要的是,到目前为止,AI 推理之间存在一种分裂,以整数格式(通常为 INT8,但有时为 INT4)以低精度完成,与 AI 训练以 FP16、FP32 或 FP64 精度完成,HPC 以 FP32 或 FP64 精度完成。NVIDIA和 Intel 都认为 FP8 不仅可以用于推理,在某些情况下还可以用于 AI 训练,从而从根本上提高其加速器的有效吞吐量。
AI芯片企业Graphcore 也正在推动 IEEE 采用供应商为 AI 设计的 FP8 格式作为其他所有人都可以使用的标准。此外,AMD 和高通也支持将FP8格式作为标准格式,以帮助降低云和边缘的训练和推理成本。”
NVIDIA官方再度公布的最新消息显示,美国政府对NVIDIA继续开发H100集成电路的出口、再出口和国内转让的许可进行了授权。这也意味着NVIDIA无需将某些业务转移到中国境外。另外该授权还允许NVIDIA在2023年3月1日前为A100 GPU的美国客户提供必要的出口支持(这里应该指的是在大陆的美国客户);同时,授权A100和H100在2023年9月1日之前通过NVIDIA的香港公司履行订单和物流。
虽然,NVIDIA A100/H100系列产品在美国给出的“缓冲期”之内仍然可以通过其香港公司对中国大陆的出口,但是“缓冲期”过后,则必须有美国政府的许可才能出口。因此,一些大陆客户为了保障供应,赶在“缓冲期”内加大了A100/H100的采购量,也并不奇怪。
需要指出的是,从美国的禁令来看,只要性能小于A100的产品的都是能够正常对国内出货的。那么鉴于国内市场的庞大需求,NVIDIA完全是有能力、也有动机来专门为中国市场推出一款性能略低于A100的产品,比如搞个A90来规避美国的出口许可机制,同时又能满足国内的需求。预计“缓冲期”过后,NVIDIA有可能会推出相应的产品。
尽管NVIDIA的游戏业务收入在2022年二季度出现严重下滑,但是在独立GPU市场(包括AIB 合作伙伴显卡), NVIDIA仍保持着79%的份额,稳居第一。根据市场研究机构Jon Peddie Research的最新数据显示,2022年二季度,全球独立GPU市场出货量较去年同期增长 2.4% 至 1040 万台,但是较一季度环比则下滑了22.6%。NVIDIA在独立GPU的显卡市场出货量虽然同比增长了近3%,但是环比却下滑了19.1%。而这主要是由于PC出货量及虚拟币挖矿需求下滑所引起的。
NVIDIA公司(纳斯达克代码:NVDA)是全球可编程图形处理技术领袖。与ATI(后被AMD收购)齐名,专注于打造能够增强个人和专业计算平台的人机交互体验的产品。公司的图形和通信处理器拥有广泛的市场,已被多种多样的计算平台采用,包括个人数字媒体PC、商用PC、专业工作站、数字内容创建系统、笔记本电脑、军用导航系统和视频游戏控制台等。NVIDIA全球雇员数量超过4000人。全球各地众多OEM厂商、显卡制造商、系统制造商、消费类电子产品公司都选择NVIDIA的处理器作为其娱乐和商用解决方案的核心组件。在PC应用领域(例如制造、科研、电子商务、娱乐和教育等),NVIDIA公司获奖不断的图形处理器可以提供出色的性能和鲜锐的视觉效果。其媒体和通信处理器能够执行宽带连接和通信应用中要求十分苛刻的多媒体处理任务,并在音频应用能力方面取得突破。NVIDIA产品和技术的基础是NVIDIA ForceWare,这是一种综合性软件套件,能够实现业内领先的图形、音频、视频、通信、存储和安全功能。NVIDIA ForceWare可以提高采用NVIDIA GeForce图形芯片和NVIDIA nForce平台解决方案的各类台式和移动PC的工作效率、稳定性和功能。