英伟达Tegra K1深度解读：技术很牛

时间：2014-01-16 16:38:54

手机看文章

扫描二维码
随时随地手机看文章

[导读] 1月10日消息，在今年的CES展上，Nvidia为我们带来了Tegra系列移动芯片当中的最新成员——Tegra K1。这款芯片将会把Nvidia苦苦挣扎的移动处理器业务和更为成功的桌面显卡部门联合在一起。根据Nvidia的说

1月10日消息，在今年的CES展上，Nvidia为我们带来了Tegra系列移动芯片当中的最新成员——Tegra K1。这款芯片将会把Nvidia苦苦挣扎的移动处理器业务和更为成功的桌面显卡部门联合在一起。

根据Nvidia的说法，Tegra K1将会为移动设备带来“下一代家用机的游戏图形性能”，但功耗仅有2W。Nvidia是如何办到这一切的呢？科技网站Android Authority日前就撰文对Tegra K1进行了深度介绍。文章内容如下：

大量的CUDA核心

Tegra K1总共拥有192个显卡处理核心（Tegra 4为72个），这无疑是这款芯片的一大亮点。显卡的“血统”要比核心数量更为重要，而在这一点上，Tegra K1也没有让我们失望。不同于Tegra 4，Nvidia直接把Kepler架构用在了Tegra K1身上，让后者和GTX 680，Titan和780Ti这些桌面显卡站在了同一水平线上。

虽然Nvidia并没有对Tegra K1的Kepler架构进行多少改动，但把它和上面这些顶级桌面显卡放在一起比较的确有点不公平。Tegra K1只有单独一个Nvidia SMX单元，其中包含了192个CUDA核心，8个纹理单元，4个光栅处理单元，这和Nvidia的顶级显卡系列相比明显少了很多。就拿GTX 680为例，这款显卡拥有1536个CUDA核心，128个纹理单元，32个光栅处理单元。

Nvidia并未提及Tegra K1核心的时钟频率或者是带宽，但在CES的展示当中，他们的确给出了Tegra K1的着色器性能峰值：365 GFLOPS。目前还很难去测算这款芯片的实际性能，但我们还是可以进行一些比较。比如说，定位低端的OEM版本GT630拥有192个CUDA核心，其着色器性能峰值为336 GFLOPS。

比较应该已经足够了，那么Nvidia是如何把这一切放进一枚功耗仅有2W的芯片当中的呢？

从彼此独立的芯片转向单独一枚SoC会带来节能性上的明显提升，而大幅缩减核心和光栅处理单元的数量也得以让Tegra K1的功耗能够低于Nvidia的Kepler笔记本芯片系列（已经在20W以下了）。更大的128KB L2缓存也降低了消耗在片外存储器访问上的能源。

对于效率管理能耗的低级别优化也应该被给予特别的关注。门控电源和门控时钟会快速识别出闲置的GPU核心，并降低时钟频率或者是彻底封闭这些区块，以此达到降低功耗的目的。对于ASTC纹理压缩的支持也会帮助降低UI和3D渲染的工作量。

无论是从图形性能还是节能性上面，Tegra K1都是巨大的进步。但并非所有的提升都来自于硬件部分。

下一代API

要说在移动设备上提供下一代游戏体验这方面，Tegra K1最显著的新功能就是全面的图形API支持了。也许你还记得，Tegra 4并不支持OpenGL、CUDA和DirectX 11这些常见的API，只是对部分游戏进行了优化，这还要取决于开发者。Tegra K1在这方面得到了改善，带来了对于OpenGL 4.4，微软DirectX 11.2，OpenGL ES 3.0和Nvidia自家CUDA 6的全面支持。

新的API自然也带来了图形性能上的新提升，比如对于FXAA和TXAA抗锯齿和Nvidia PhysX物理加速引擎的支持，还有Compute Shaders所带来的一整套高级特效（比如环境光遮蔽）。Tegra K1同时也是市面上首款支持硬件曲面细分的移动显卡，不过高通正在开发的Adreno 420同样也会具备该功能。

这所带来的好消息就是，PC和家用机游戏的开发者现在可以把自己的作品进行压缩，然后放到移动设备上让Tegra K1运行。考虑到这款芯片的性能据称是要强过PlayStation 3和Xbox 360，所以跨平台移植也不是没有可能。Nvidia在展会现场已经展示了Unreal Engine 4、《英雄萨姆3》和《三位一体2》的移植版，Tegra K1运行起来毫无问题。

两种CPU设计

Tegra K1共有两种CPU版本，针脚设计完全兼容，这也就意味着厂商可以轻松在两者之间进行互换。第一种是我们所熟悉的四核+Cortex A15排布，架构和Tegra 4几乎完全相同。而第二种加入了Nvidia自己的双核ARM CPU。

和Tegra 4一样，Tegra K1的CPU共有4个满速A15核心，用于处理繁重任务，额外的一个低性能A15“附属核心”就负责一些简单任务。每一个核心还可以被封闭以降低能耗，只有在需要时，额外的核心才会开启。但K1和Tegra 4之间有一个细微的差别，那就是前者的CPU是基于新的第三版ARM Cortex A15核心设计。

第三版Cortex A15主要对门控时钟进行了封闭，从而达到了提升节能性的目的。转换到28nm HPM制程工艺也进一步降低了能耗，Nvidia也将时钟速度提升了20%，从1.9GHz提高到了2.3GHz。

Tegra K1的A15处理器也要比Tegra 4的稍快一些，但提升程度并没有Kepler显卡那样大。但是，这种久经考验的四核设计意味着Nvidia可以很快开始Tegra K1的生产，OEM厂商预计会在本季度收到供货。

而代号为“Denver”的第二种CPU设计就完全不同了。Nvidia彻底放弃了附属核心这种设计，而选择了更加传统的双核配置。这两个核心基于新的ARMv8架构，同时支持64位和32位。Denver的最高时钟频率锁定在2.5GHz，同时具备更大的128KB L1指令缓存和64KB L1数据缓存。不过遗憾的是，目前有关Denver的信息还非常有限，不过Nvidia放弃流行的四核设计而选择双核的举动值得玩味。

丰富的多媒体功能

Nvidia同时赋予了Tegra K1许多额外的功能。这款芯片的图像信号处理器（简称ISP，负责多种图像任务）得到了升级，数量也增加到了两个。

每一个ISP都具备14位输入下6亿像素/秒的处理能力（Tegra 4为10位下4亿像素/秒），降噪能力得到了提升，同时还能支持1亿像素图像感光元件。双ISP的加入也让双摄像头操作成为可能，我们也已经在其他设备上看过了类似功能。和Tegra 4一样，K1同样支持通过HDMI输出4K视频内容，但它的GPU能否处理4K 3D游戏让人怀疑。

结语

Tegra K1终于体现出了Nvidia的真正实力，但从这一点上看，它就是一款让人非常兴奋的产品。K1也很有可能被加入到下一代Nvidia Shield当中。

对于Nvidia来说，摆在面前的最大障碍依然是找到足够大的消费者基础。在移动设备上获得家用机的游戏质量还不是普罗大众所追求的。再过几年后，像Steam OS这样的项目可能会推动游戏在Linux平台的发展，到那时，Android平台的一款强大游戏芯片可能会更加诱人。

从技术角度看，Tegra K1很强大，但在休闲游戏所主导的移动市场，它可能并没有看上去那么开创性。我们还需等待开发者们能够利用Kepler给我们带来些什么，以及Denver有没有什么新内容。