英特尔Sunny Cove架构有重大改进!
扫描二维码
随时随地手机看文章
可以看到,英特尔为核心的整数部分配备了更多LEA(有效地址载入)单元,用来进行内存寻址计算,可能在需要频繁内存计算的情况下,通过安全更新来缓解性能损失,或者通过恒定的偏移,有助于高性能阵列代码。
MUL(乘法)单元从Skylake的端口5转移到了端口1,可能是出于平衡设计的目的,同时还增加了一个iDIV整数除法单元。
这个变化并不大,10nm Cannon Lake也有一个64位的IDIV,可以将64位证书出发从97个时钟周期(混合指令)降低到18个,Sunny Cove可能也与之类似。
INT整数运算方面,Skylake端口5的乘法单元变成了MulHi单元,但在新架构中的具体作用尚不明晰。
FP浮点运算方面,Sunny Cove增加了重排资源,因为英特尔收到客户反馈,希望能消除代码中的瓶颈。
英特尔没有具体说明核心浮点部分FMA(熔加运算)单元的功能,但我们知道,核心内有一个AVX-512指令单元,所以至少会有一个FMA单元会与之交互。
Cannon Lake架构只有一个512位FMA单元,很可能延续到了这里,在至强上可能会有两个。
为了更明晰地对比Skylake、Sunny Cove的后端执行资源变化,外媒AnandTech还做了个对比表格如下:
英特尔列出的其他内核改进还有:分支预测器改进、有效载入延迟降低(得益于TLB/L1D)等等,但是英特尔也承认,这些改进不会让每个人获益,需要新的算法在特定代码中使用。
另外,Sunny Cove还支持更大的内存,主内存分页表现在是5层设计(之前是4层),支持的线性寻址空间达到57位,物理寻址空间则是52位。
这意味着,至强服务器平台理论上每颗处理器可以搭配最多4TB内存,而现在Skylake-SP架构的可扩展至强只有1.5TB,AMD霄龙也不过2TB。
事实上,Sunny Cove是自从AMD 2003年引入x86-64 64位架构以来,第一个对x64虚拟内存寻址做出重大变革的架构。
这十几年来,虽然虚拟内存寻址都支持64位,但实际上只有前48位有用,后边的16位只是前边简单的拷贝而已,这就将虚拟寻址空间限制在256TB。
这些虚拟内存通过分页表映射到物理内存,使得物理内存内存寻址也被限制在48位,导致整个系统的最大物理内存不能超过256TB。
现在,Sunny Cove将有效的虚拟内存寻址扩展到了57位,物理寻址则是最多52位,结果就是虚拟内存、物理内存最多分别可以支持到128PB、4PB。
根据英特尔之前给出的路线图,Ice Lake-SP家族的新一代至强将在2020年上市,届时内存扩展能力将得到前所未有的提升。
顺带说,在安全方面,Sunny Cove支持多密钥全内存加密、用户模式指令预防。
至于Sunny Cove前端部分的变化,我们期待英特尔公布更多信息。
阳光海湾充满意境:虽然此图中的天空不算很Sunny,但的确Cove很美