补课——关于AMD服务器
扫描二维码
随时随地手机看文章
7nm、64核心,这些高光亮点为AMD第二代EPYC带来了极高的市场关注度,而长久处于Intel统御之下的服务器市场也迫切得需要竞争的再次引入。在双重期待的加持下,AMD及其第二代EPYC处理器一时间风光无两。
但除了这些最核心的闪光点之外,AMD第二代EPYC在架构及特性上还有更多值得关注的特性。而这些特性在服务器及数据中心应用中同样有重大价值。
Chiplets设计带来的多重灵活性在第二代EPYC的设计中,Chiplets架构绝对是一大亮点。在代表了处理器先进设计思路、降低处理器设计难度和提高良率的同时,Chiplets也能够为处理器带来更多灵活性。
首先,作为一家Fabless工厂,第二代EPYC中并非所有组件的设计都来自于AMD自己。实际上,这一代产品中,AMD就将自己设计的核心架构、内部总线与合作伙伴的PCI-E 4.0控制器IP结合在了一起。
由于不同半导体IP与工艺制程有着相当强的绑定关系,而要将TSMC的7nm工艺应用在这一IP上还需要更多的调试、优化周期及资金支持,因此,Chiplets的分体式小芯片设计使得AMD可以在一颗处理器上使用不同的工艺制程(Core部分使用7nm工艺,而包含PCI-E 4.0控制器的IO部分则使用14nm工艺)。
其次,在第二代EPYC的架构中,每8个核心配合对应的L3缓存构成一个CCD(Core Complex Die),以一个独立的DIE进行封装。如果是满配的64核产品,那么8个CCD无疑是必不可少的;但如果是32核产品,如何排布就会有很大差异:即可以由4个满配的CCD组成,也可以由8个屏蔽掉4核心的CCD构成。不过,由于每个CCD采用的是共享式的L3缓存,所以在第二种32核产品的构型中(8个CCD屏蔽掉一半的核心数量),我们就得到了L3缓存翻倍的新产品产品。这样的全新组合方式能够让AMD在核心数量和主频之外创造一个衡量性能(通过L3缓存容量的增加来提升执行效率)的新维度。
目前,在48核心产品上我们已经能够见到类似设计的产品——EPYC 7642(2.3GHz,256MB L3)和EPYC 7552(2.2GHz,192MB L3)。而这一性能分级思路未来据悉也将应用在32核心产品上。显然,这为缓存敏感型应用提供了一个全新的选择。
在互联总线上提供更多选择第二代EPYC的一大特点便是能够在单插槽的情况下提供最高128个PCI-E 4.0通道。但目前用户普遍认为,由于处理器互联——xGMI总线与PCI-E总线共享整个外部IO带宽;因此,一般情况下,双路配置的第二代EPYC服务器所能提供的PCI-E 4.0通道数仍为128个。
但实际上,这种“普遍认知”并不完全正确。
AMD中国区商用事业部技术总监刘文卓
对此,AMD中国区商用事业部技术总监刘文卓表示:“每颗第二代EPYC处理器内部包含4条可以用于双路系统中处理器互联的xGMI总线。用户可以选择将4条xGMI全部用于处理器互联,也可以选择只使用其中的3条。”
AMD xGMI互联总线示意图(图片来自STH)
在全部4条xGMI用于互联时,双路系统的确与单路系统一样可以提供128个PCI-E 4.0通道;但如果主板制造商只使用3条xGMI通道进行互联,那么每颗处理器还将释放相当于16个PCI-E 4.0通道的带宽(两颗处理器就可以多提供32个PCI-E 4.0通道),从而将双路系统的PCI-E 4.0通道数量提升至160个(加上系统提供的额外两个PCI-E 2.0通道,整个双路系统最高可以提供162个PCI-E通道)。
当然,由于双路系统xGMI互联通道的不同,需要主板在布线上进行对应调整,并且服务器PCI-E通道数量的变化需要通过物理插槽的多寡来体现。因此,第二代EPYC处理器在互联方式上所体现出来的灵活性更多是面向主板制造商和系统制造商的。
所以,在处理器之间数据交流不甚频繁的云存储、防火墙、软件定义网络等场景中,制造商可以选择使用3条xGMI通道进行互联,从而获得更多的PCI-E通道数,进而获得更好的系统扩展性;而在其他一些更需要处理器数据交换的领域,系统制造商则可以选择4条xGMI通道全部启用,以实现更好的系统整体性能。
全面发力企业生态在产品端为用户带来全面性能提升和更多性价比选择的同时,AMD也清醒地意识到了自身在企业应用生态方面的短板。目前,由AMD中国区商用事业部技术总监刘文卓领导的庞大FAE团队已经全面开始了第二代EPYC软硬件的支持工作,其内容涵盖应用调优、Linux核心补丁、软件编译、HPC以及硬件平台开发等。而在后端,面向全球的软硬件工程团队的支持也已经全面展开。
对此,刘文卓表示:“AMD已经组织了庞大的生态系统团队来为新处理器和平台进行应用相关的适配、调优和认证工作。而且,由于x86 64位指令集是AMD公司创建的,应用程序有着几乎完整的兼容性。另一方面,AMD在行业内仍旧保持着广泛的合作关系,所以相关工作进行得亦很顺利。目前,很多用户对第二代EPYC都非常感兴趣,而从产品在用户数据中心内的测试效果来看,即便在没有进行针对性优化的前提下,第二代EPYC仍旧表现出了非常好的性能。用户满意度很高。”
当然,要构建一个从硬件到应用的完整生态,单凭AMD的一己之力是不够的,在更多情况下,应用开发商需要针对新平台进行自主调优和适配。为此,AMD已经在8月初发布了全新的AOCC 2.0版本,其中包含了对Rome架构第二代EPYC全面支持和调优。通过新的编译器,应用可以在第二代EPYC平台上获得最佳性能。
同时,使用Intel ICC的用户也无需太过担心。因为即便是在ICC上,第二代EPYC更多的物理核心和更优秀的架构也能够带来性能的大幅提升。因此,即便是Intel所主导的ICC也能够发挥出第二代EPYC的绝大部分性能。
为什么没有四路产品?在AMD看来,目前大部分四路产品看重的并不是单机的处理器性能,而是为了追求更高的单机内存容量,以满足内存数据库等应用的需求。而通过全新的8通道内存控制器,第二代EPYC已经能够在单插槽支持高达4TB的ECC DDR4 3200,双路系统的内存支持则直接翻倍为8TB。对于绝大多数内存数据库应用来说,这个级别的内存容量支持已经完全够用。
从大型数据中心入手,将竞争带回市场客观来讲,AMD仍旧是服务器市场中的追赶者,但好在AMD已经在产品和市场关注度上迈出了积极且成功的一大步。
以此为基础,包括大型互联网数据中心和全球各大服务器供应商在内的众多用户都已主动向AMD伸出了橄榄枝并提供了积极的反馈。
但AMD并没有被第一步的成功冲昏头脑,相反,AMD清楚地明白自身的优劣势。刘文卓表示,在本代产品中,AMD将自己的定位明确为包括企业级和HPC在内的大型数据中心市场。
明确的定位能够帮助AMD更有效地利用手上的资源和人力,把好钢用在刀刃上,取得事半功倍的效果。当然,也只有在这片出货量最大的市场站稳脚跟,AMD才能像苏姿丰博士所说的那样,将竞争带回数据中心市场。
免责声明:本文内容由21ic获得授权后发布,版权归原作者所有,本平台仅提供信息存储服务。文章仅代表作者个人观点,不代表本平台立场,如有问题,请联系我们,谢谢!