NVIDIA Turing GPU架构图泄露,发现了这些...
扫描二维码
随时随地手机看文章
8月21日,NVIDIA终于在德国发布了新一代游戏显卡,在发布会上,NVIDIA将大家注意力全都集中到了光线追踪技术上,而昨天我们也在超能课堂中进行了详细介绍。不知道大家发现没,目前对于新一代图灵架构显卡,除了知道个名字,知道加入了RT Core以外,其余一概不知,甚至连一张详细的GPU架构图都没有,这个情况在以往都没有出现过。不过万能的VideoCardZ居然找到一张标着Turing GPU架构图片,我们可以从中发现一些端倪。
来自VideoCardZ,图片可放大
泄露的是TU102核心的架构图,也是Quadro RTX 8000、Quadro RTX 6000专业卡以及RTX 2080 Ti游戏卡所采用的核心。不过只有Quadro RTX 8000、Quadro RTX 6000专业卡采用了完整版的TU102核心,RTX 2080 Ti依然是不完整的,也就是我们了解到的TU102-300核心。
上面标注的信息分别为“72组SM单元,4608个CUDA单元,576个Tensor核心,72个RT核心,32个几何单元,288个纹理单元,96个光栅单元,2通道NVLink”。计算一下可得,一组SM单元依然是64个CUDA单元没变,配备8个Tensor单元、1个RT Core,这些没有疑问。
从GPU架构图上看,一共是6组GPC单元,一组GPC里面又有12个SM单元。不过泄露的图片是在太糊,细节辨认不到,但是我们可以比照上一代的Volta架构以及老黄在发布会上的所讲内容大胆推测一下。
Volta架构SM单元内部,可点击放大
首先我们看看SM单元内的变化,原本Volta里面是有FP64、INT、FP32、Tensor Core四种单元,但是到了Turing中只剩下三种,那么被砍掉的是FP64双精度单元,其余的都被保留了。那么新加入RT Core应该在哪里,你可以发现,SM单元中多了个巨大的黄色框框,高度怀疑就是RT Core,其数量也刚好吻合1 SM单元比1 RT Core比例。
此外,早在发布会前也有外媒表示,NVIDIA已经对SM单元共享的L2缓存增大一倍,L1缓存也增大了1.7倍,估计是为了增强运算性能。