NVIDIA正式公布Turing架构:新增RT Core
扫描二维码
随时随地手机看文章
虽然NVIDIA正式公布新一代的GeForce游戏卡应该要等到下周科隆游戏展前的“GeForce Gaming Celebration”活动,但是在昨天正式开幕的SIGGRAPH 2018,这场图形界顶级大会上,NVIDIA是不可能空手到来的,而事实上他们昨晚确实有很多重量级的公布,包括全新的Turing架构(注意,官博现在还没有使用任何中文命名),包括第一张专用于光线追踪的GPU:Quadro RTX,但是我们还是应该从它的根基:新的Turing架构开始说起。
NVIDIA的官方直播大概是早上的8:45结束的,现在还有很多细节没有公布出来,所以我们先来看看官方的Newsroom,首先关于Turing架构,NVIDIA对其非常有自信,称其为自从2006年通过统一渲染架构带来CUDA后最伟大的飞跃,所以你可想而知NVIDIA对其的期望,或者说野心。新的Turing架构很重要的一点就是混合渲染(Hybrid Rendering)来实现光线追踪,具体来说包括引入全新的RT Core来加速光线追踪,还有我们已经在Volta架构看到的Tensor Core来加速AI处理,当然还有光栅化,毕竟现在我们还没有厉害到能够抛弃光栅化的程度,所以新的Turing架构是包含多种力量的,而这种包含多方力量来实现光线追踪的混合渲染,应该会成为日后的关键词。
每次有新架构到来,我们最关心的就是微架构级别的变化:有哪些新增的特性,有哪些精简的部分,如果说Volta架构我们开始看到Tensor Unit,那么新的Turing架构当中最重要的就是新引入的RT Core。既然是“RT”,顾名思义就是冲着光线追踪(Ray Tracing)来的,它的作用是用来加速处理光线在三维环境中的传播,处理光线的速度是目前Pascal架构的25倍,同时让GPU作为节点处理最末帧(Final Frame)的效果渲染要比将CPU作为节点的速度快30倍。
同时让人兴奋的是,自从Volta架构开始引入的Tensor Core,我们都知道它能提供远远高于传统GPU的人工智能、深度学习性能,这部分性能能够赋予我们的GPU去做很多以往没有的工作,比如说在Turing架构当中的Tensor Core,能够在每秒处理500万亿的张量运算,通过这部分性能,我们能实现以往无法奢望的功能,比如说新的基于深度学习的抗锯齿技术:DLAA(Deel Learning Anti-Aliasing,万物基于深度计算)。
最后在传统的架构方面,Turing在我们熟悉的SM单元当中新增整数处理(Integer Unit)单元,以及新的统一缓存架构,能够带来目前架构两倍的带宽。规格方面,Turing架构能够搭载最多4608 CUDA,并且能够带来最高16 TFlops浮点性能。