显卡工作原理
扫描二维码
随时随地手机看文章
显卡工作原理
首先我们应该了解一下显卡的简单工作原理:首先,由CPU送来的数据会通过AGP或PCI-E总线,进入显卡的图形芯片(即我们常说的GPU或VPU)里进行处理。当芯片处理完后,相关数据会被运送到显存里暂时储存。然后数字图像数据会被送入RA骂死我吧AC(Random Access Memory Digital Analog Converter),即随机存储数字模拟转换器,转换成计算机显示需要的模拟数据。最后RA骂死我吧AC再将转换完的类比数据送到显示器成为我们所看到的图像。在该过程中,图形芯片对数据处理的快慢以及显存的数据传输带宽都会对显卡性能有明显影响。
技术参数和架构解析
一、核心架构:
我们经常会在显卡文章中看到“8×1架构”、“4×2架构”这样的字样,它们代表了什么意思呢?“8×1架构”代表显卡的图形核心具有8条像素渲染管线,每条管线具有1个纹理贴图单元;而“4×2架构”则是指显卡图形核心具有4条像素渲染管线,每条管线具有2个纹理贴图单元。也就是说在一个时钟周期内,8×1架构可以完成8个像素渲染和8个纹理贴图;而4×2架构可以完成4个像素渲染和8个纹理贴图。从实际游戏效果来看,这两者在相同工作频率下性能非常相近,所以常被放在一起讨论。
举例来说,nVIDIA在发布GeForce FX 5800 Ultra的时候,对于其体系架构就没有给出详尽说明。后来人们发现官方文档中提到的每个周期处理8个像素的说法,只是指的Z/stencil像素,其核心架构可以看作是GeForce4 Ti系列4×2架构的改进版本,其后发布的GeForce FX 5900系列也是如此。ATi的Radeon 9700和9800系列则具有完整的8条像素渲染管线。但是这些显卡的性能基本上都处于一个档次。
目前主流的中低端显卡,基本上都是4×1架构或2×2架构,也就是单位周期只能完成4个纹理贴图。而更高端的产品则拥有12×1架构甚至16×1架构。
二、核心工作频率:
俗话说得好:“勤能补拙”。虽然高规格的架构拥有先天性的优势,但是中低规格的核心架构通过提高工作频率,也可以达到接近中高端产品的性能。
举例来说,Radeon 9500PRO采用的是8×1架构,而Radeon 9600XT则只是4×1架构。不过采用0.15微米制造工艺的Radeon 9500PRO核心/显存工作频率是275MHz/540MHz,而采用0.13微米工艺的Radeon 9600XT则达到了500MHz/600MHz,核心频率几乎是前者的两倍。因此在单位时间内,它们可完成的像素渲染和纹理贴图工作量大致相当,因此性能处于同一水平。所以采用更先进制造工艺,拥有良好超频性能的显卡产品往往很受玩家欢迎。
三、显存带宽:
在大型3D游戏等应用中,显卡的图形芯片与显存之间经常需要进行大量的数据交换。这时如果显存的数据传输带宽太低,就会严重制约数据的顺利传输,导致图形芯片时常处于“等米下锅”的状态,这也是对芯片性能的浪费。所以DIY玩家在超频显卡时,往往是将核心/显存频率一起提升,这样就不容易让显存带宽成为制约显卡性能的瓶颈。64bit显存位宽的显卡之所以被玩家们所“鄙视”,也正是因为其显存的数据传输带宽大幅缩水。
除了前面提到的内容外,图形芯片的处理效率以及驱动程序的优劣也都是影响显卡性能的重要因素。
解读显卡性能
通过上面的介绍,我们应该不难从显卡的技术参数中了解其实际性能。例如在真实游戏测试中,4×2构架的GeForce4 Ti 4200速度居然屡屡胜出采用4×1构架的GeForce FX 5600、5700以及Radeon 9600、9600PRO等中高端显卡。只有GeForce FX 5700Ultra和Radeon 9600XT才略为挽回一点面子,不过它们的核心工作频率比起GeForce4 Ti 4200几乎翻了一番,售价也几乎高出后者一倍。要不是无法支持DirectX 9特效限制了GeForce4 Ti 4200的施展空间,当今市场上的诸多中端显卡都将面临非常难堪的境地,也难怪4200能成为一代经典。而如果选择4×1/2×2构架的显卡产品,我们也可以通过超频使其达到更好的性能。