英伟达担心单一GPU架构会逐渐失去计算优势:今年将加大GPU供应
扫描二维码
随时随地手机看文章
英伟达的GPU现在可以买到的价格依然和官方定价相去甚远。CES 2022上,NVIDIA发布了新卡,包括30系列中最便宜(1899元)的RTX 3050、RTX 3080 12GB、RTX 3070 Ti 16GB等以及笔记本高端GPU(RTX 3080 Ti/3070 Ti),那么大伙能否原价买到呢?
虽然NVIDIA没有正面回应,但公司CFO Colette Kress在本周小摩举办的科技峰会上表示,他相信在2022自然年,NVIDIA会有非常好的供货局面,足以应对市场需求。可能暗示下半年要发新卡,比如RTX 40系列,Kress指出,事实上我们已经和伙伴一道,就下半年的产能紧密协作了。此前有消息称,进入1月份之后,RTX 30系列的供货情况将会大为改善,预计比12月份增加大约15%。对于NVIDIA来说,除了桌面显卡,还要兼顾笔记本市场,希望Kress此番表态说话算数吧。
1 月 7 日消息,今日英伟达正式推出第 4 代 Max-Q 技术,让轻薄游戏本和设计本拥有更出色性能,提供更长的续航时间。
官方表示,游戏玩家和创作者对笔记本电脑的性能期望与日俱增,对时尚外观和长效续航的追求也不会松懈。为此,英伟达继续发展 Max-Q 技术,注重能效,优化 CPU 和 GPU 性能释放。
第 4 代 Max-Q 第一项技术名为 CPU Optimizer 智能协作。该功能可以让 GPU 进一步优化 CPU 性能、温度和功率,使 CPU 能效得以提升,在需要时可以将功率转移给 GPU,以实现更佳游戏性能。
第二项技术是 Rapid Core Scaling 智能核心优化,可以使 GPU 能实时感知应用的当前需求,并仅使用所需数量的核心。这样可以使得活跃核心能够以更高频率运行,可以使创意工作应用性能最高提升达 3 倍。
第三项技术是 Battery Boost 2.0 续航增强。这一技术针对电池使用场景设计,利用 AI 人工智能技术,在 GPU 和 CPU 功耗、电池电量、画质和帧率之间找到绝佳平衡。Battery Boost 2.0 技术可以提升电池模式下的游戏体验,并使得笔记本续航时间延长多达 70%。
Nvidia正在为macOS推出GeForce Now 2.0.36版本,它带来了对RTX 3080层的1600p游戏性的支持。更高分辨率的游戏玩法可在所有M1 Macbook上使用,包括Macbook Pro和Macbook Air。
这次更新还为苹果最新的M1 Max Macbook带来了优化,修复了在正确的长宽比下的流媒体。
该更新还包括在苹果MacBook Pro M1 Max上以正确的长宽比进行流媒体的修复,以及在游戏内覆盖物上查看时对倒计时的改进。
GeForce NOW RTX 3080成员现在可以在他们的M1 Macbook Air或Macbook Pro上以原生分辨率播放,达到光荣的1600p。流媒体的会话时间甚至更长--最长可达8小时。有了RTX 3080和Priority会员的RTX ON,可以体验像《赛博朋克2077》和《控制》这样的实时光线追踪游戏,而无需升级到PC。
近期,英伟达研究人员发表了一篇文章,详细介绍了英伟达正在探索如何为未来产品部署多芯片设计方案。随着异架构计算的兴起,英伟达正在寻找一种方法,增加其半导体设计的灵活性,以根据工作负载的不同,灵活匹配各种模块,这也是MCM多芯片封装的用武之地。
英伟达对多芯片设计的研究最早是在2017年被曝光,当时英伟达展示了通过四个小芯片构建的设计方案,不但提升了性能,还有助于提高产量(较小的芯片良品率会提高),而且还允许将更多的计算资源集合在一起。多芯片设计还有助于提高供电效率,以及有更好的散热效果。
英伟达目前在MCM多芯片封装GPU上的做法称为“Composable On Package GPU”,或COPA。文章里阐述了英伟达如何处理HPC和AI工作负载之间的差异,随着两者计算需求的变化,对计算的要求也渐行渐远。英伟达担心,过于单一的GPU架构,会逐渐失去HPC和AI工作负载中的计算优势,而两者的市场规模却在日益增长。
为了更好地应对未来的计算需求,英伟达一直在模拟不同的多芯片设计和配置,确认不同工作负载所需要的硬件模块情况。根据英伟达提供的数据,在HPC工作负载上,减少25%的显存带宽实际上只降低了4%的性能,如果再减少25%,性能损失则再增加10%。因此,减少50%的显存带宽并移除相关硬件模块后,可以替换成更合适的硬件模块,为对应的工作负载提供相应的性能,从而提高效率。由于并不是所有硬件模块都是对等的,个别功能是不可或缺的,COPA是英伟达尝试模拟多芯片设计的影响,以及与性能之间的关系。
英伟达目前优先考虑的是HPC和AI市场,除了高利润的因素以外,不少企业通过定制解决方案的做法逐渐蚕食着英伟达的市场空间。当然,这种根据工作负载做针对性配置的做法也可以应用与英伟达其他GPU产品线,包括消费市场的GeForce显卡。不过与专业市场不同,游戏中的渲染工作方式有着本质上的区别,如果采用多芯片设计,则需要进一步提高小芯片之间的互联速度。