史上最疯狂专业卡评测:来吧,16GB显存
扫描二维码
随时随地手机看文章
一个多月前,AMD发布了最新款基于Hawaii GPU的专业显卡“FirePro W9100”,配备了令人瞠目结舌的16GB GDDR5海量显存(此前最多12GB)。我们迫不及待地想一睹其风采,只可惜专业卡平常很难见到。Tom's Hardware近日终于搞到了一块,并和AMD、NVIDIA最近两代高端专业卡进行了详细的对比测试,看看这么多显存有啥用吧。
【FirePro W9100实卡赏析】
FirePro W9100体型庞大,本体就有11.1英寸(28.19厘米),算上末端的辅助供电接口则超过12英寸(30.48厘米),高度为4.06英寸(10.31厘米),厚度则是1.36英寸(3.45厘米),重量也达到了2.42磅(1.1公斤)。
因为是专业用途,显卡设计不求美观,但求实用。散热方案还是真空腔均热板加涡轮风扇,基本和上代FirePro W9000差不多,效果可以,但注定不会很安静。
背面有金属辅助背板(厚约5毫米),支撑兼散热。
顶部也没有了CrossFire交火金手指,因为现在不需要它了。尾巴上那个接头是用来链接FirePro S400同步模块的。
6+8针辅助供电接口在尾部。
输出接口是六个miniDP和一个三针mini-DIN,后者用于3D立体显示,前者支持六台4K/30Hz,或者三台4K/60Hz。
【测试平台配置:四大金刚】
测试平台的处理器是IVB-E Core i7-4930K 3.5GHz六核心,不超频,因为工作站都是稳定为先,搭配主板华硕Rampage IV Black Edition,内存是海盗船64GB DDR3-1600,电源海盗船AX860i。
系统和程序安装在三星840 Pro 256GB上边,视频编辑环节的视频放在海盗船Neutron GTX 480GB,输出到三星840 EVO 500GB,以求获得最大化性能。
操作系统方面,专业软件和计算环节采用Windows 7 64位旗舰版,游戏环节采用Windows 8 64位专业版。显卡驱动是催化剂专业版13.35、NVIDIA Quadro 334.95。
测试室温22℃,开启空调保持恒温。
测试显卡主要规格:
FirePro W9100:Hawaii核心,2816个流处理器,核心频率最高930MHz,单、双精度浮点性能5.24、2.62TFlops,512-bit 5GHz 16GB GDDR5显存,热设计功耗275W,发布售价3999美元。
FirePro W9000:Tahiti核心,2048个流处理器,核心频率975MHz,单、双精度浮点性能3.99、1.00TFlops,384-bit 5.5GHz 6GB GDDR5显存,热设计功耗274W,发布售价3999美元。
Quadro K6000:GK110核心,2880个流处理器,核心频率900MHz,单双精度浮点性能5.2、1.7TFlops(后者为估计值),384-bit 6GHz 12GB GDDR5显存,热设计功耗225W,发布售价4999美元。
Quadro K5000:GK104核心,1536个流处理器,核心频率约700MHz,单精度浮点性能2.1TFlops,256-bit 5.4GHz 4GB GDDR5显存,热设计功耗122W,发布售价2249美元(目前大约1500美元)。
【OpenCL计算性能】
单双精度着色器性能:理论指标一直是FirePro的强项,W9100可以甩开K6000好几条街。
加密性能:W9100继续笑傲江湖,K5000还能勉强跑跑,K6000直接驱动错误。这主要是NVIDIA一直使用自己的封闭API CUDA,支持情况并不好,OpenCL因为开放正在慢慢普及。
Folding@Home分布式计算:GCN架构非常适合这种运算,不过K6000也不弱。
内存带宽:W9100 OpenCL略微占有,DirectX下就大不如K6000了。
二项式期权定价计算:K9100轻松数倍于K6000,事实上K9000都能大幅领先。
蒙特卡罗期权定价计算:基本同上。
通用矩阵乘法计算:K9100单精度无敌,不过双精度上K6100反超了。
快速傅立叶变换计算:同上。
【2D性能】
即便是2014年,很多软件依然使用GDI、GDI+进行绘制来绘制GUI图形界面,而一些较老的、专用的软件更是在大量依靠它们,不过因为现代显卡都是统一着色器架构,没有了单独的2D单元,现代操作系统也无法直接访问显卡,所以这里更能体现驱动程序的实力。
八个项目中,W9100有五次和W9000不相上下,只有一次略微领先,还有两次倒数第一、一次倒数第二。
总的来看,W9100、W9000没什么不同,但同时领先K6000 23%,优势很大。
【SPECviewperf 12 3D基准性能】
SPECviewperf 11已经好几年了,不适合现代场景,AMD、NVIDIA的优化也已经十分到位,因此SPEC(标准性能评估公司)发布了最新版本,包含了多个最新的3D建模渲染组件,而且加入了能源、医疗两个专业项目。
注意:两家都是这家组织的成员。
W9100比上代进步了18%,但是K6000更猛,大幅领先35%。
W9100没什么进步,而且还不如费米架构的Quadro 6000,而且不到K6000的一半。驱动优化不行。
W9100终于登顶,AMD、Autodesk的合作不错,但优势很小。
W9100仅次于K6000,都比旧卡好得多。
W9100输给了K6000,不过比其他卡还是快得多。
K6000简直疯了,W9100则还不如K5000,而且和W9000相比没有丝毫进步。驱动还得打磨。
K9100继续悲剧,和W9000一模一样,K6000则取得了两倍多的提升,雄踞榜首。
最后一个项目,K9100终于再次拿下,不过K6000也有着翻番的进步。
【OpenCL视频处理性能】
Adobe Premiere CC Pro 4K视频转码:略微输给了K6000。
Sony Vegas Pro:W9000就足以灭掉K6000,W9100更加嚣张。
LuxMark:W9100完胜。
RatGPU:K6000更好一些,不过W9100落后得并不算很多。
【DX11游戏性能】
1080p分辨率下,W9100赢了两次,但优势微乎其微,不过到了4K分辨率,W9100更高的显存带宽起作用了,完胜。
不过,16GB显存这里并没有什么用,根本用不了那么多。
【功耗测试】
AMD、NVIDIA现在的显卡都支持动态加速,功耗也是即时变化,常规方法很难精确测量功耗。Tom's Hardware使用了HAMEG的一系列专业设备,包括HMO 3054数字示波器、三个HZ050高精度探针(分别对应3.3/12V PCI-E插槽和12V辅助供电接口然后累加获得显卡功耗)、四个HZ355探针、一个HMC8012数字万用表,还有一个PCI-E转接卡(Riser Card)。
为了说明现在的显卡功耗是多么善变,我们来看看100毫秒之间的曲线图(取样精度2毫秒):
几乎瞬间从最低值94.2W飙到了最高值356.3W。
待机功耗:关闭AMD ZeroCore节能技术,连接60Hz显示器,峰值27.2W,平均15.4W,稍稍有些高,但如此高端的卡也可以接受了。值得注意的是,16GB GDDR5显存颗粒不少,但待机时只消耗大约1W。
OpenGL 3D满载功耗:峰值368.7W,平均245.3W(TDP 275W),其中51W来自主板供电、194W来自辅助供电。
OpenCL计算满载功耗:峰值279.4W,平均260.1W。这已经是100%的负载了,但仍然没有达到TDP 275W。
【温度测试】
W9100还是比较“热情”的,待机就有40℃,满载更是达到了93℃,而上一代最高只有78℃,K6000也不过82℃。
【噪音测试】
在正对显卡中部的0.5米外,使用超心形指向高质量录音棚麦克风记录噪音,可以同时记录显卡本身噪声和周围环境噪声,后者是不可能完全消除的。
涡轮风扇从来都不安静,W9100也不例外,满载在50分贝上下,不过已经比W9000低了不少。
【结语:很强大仍需努力】
AMD FirePro这几年在专业显卡市场上的表现并不是特别好,经常硬件很出色,但是驱动不到位,而在图形工作站上,驱动比硬件更关键。
不过最近一段时间以来,AMD对专业市场的重视明显加强,屡屡提出要做好这一块,包括日前在北京举办的APU14技术创新大会上就提到了FirePro。
FirePro W9100并不足以彻底击倒NVIDIA Quadro K6000,但已经做得相当好了,也是高端图形工作站的首选产品之一,对于CAD/CAE、多媒体、娱乐、通用计算等任务都可以轻松胜任。如果能在驱动上更进一步,那就更好了。
NVIDIA CUDA的推广力度是很大的,不过毕竟是私有标准,OpenCL则在不断进步,不断赢得更多厂商的青睐,以往很喜欢CUDA的Adobe都在全力支持OpenCL,而凭借高超的计算性能,FirePro在这方面是很占优势的,能够进入苹果Mac Pro也是明证。
还有个优势就是,W9100要比K6000在价格上便宜整整1000美元。
W9100还是第一个、迄今唯一一个能够以全分辨率驱动六台4K显示器的显卡,只不过此时刷新率只能有30Hz,要想上60Hz就只能带动三台。
16GB GDDR5显存很是恐怖,但其实并没有太大实际意义,至少目前的测试、应用都发挥不出来。
比较遗憾的是,FirePro W9100的散热器效率不高,导致运行温度、噪音都不低,也影响了性能。在桌面上,很多显卡厂商已经证明,只要散热器设计到位,Hawaii GPU完全不用飙到92℃,AMD自己的水冷双芯R9 295X2更是告诉我们,完全可以压制到区区60℃。
专业卡的热量主要是通过I/O挡板排出(因为不能在机器内部积累),这和桌面卡是完全不同的。NVIDIA Quadro做得是挺好的,AMD应该好好学学。