Intel Xe独立显卡:一个架构通吃、最多1000个单元
扫描二维码
随时随地手机看文章
Intel今天正式公布了正在研发中的通用型GPU Ponte Vecchio,7nm工艺制造,Foveros 3D、EMIB封装,Xe全新架构,支持HBM显存、CXL高速互连等技术,面向HPC高性能计算、AI人工智能等领域。
事实上,Intel Xe GPU架构是一个非常灵活、扩展性极强的统一架构,并针对性地划分成多个微架构,从而可用于几乎所有计算、图形领域,包括百亿亿次高性能计算、深度学习与训练、云服务、多媒体编辑、工作站、游戏、轻薄笔记本、便携设备等等。
Intel还将Xe GPU划分成了三个档次:
1、Xe LP(低功耗):用于集成核显、入门级独显,典型功耗5-20W,最高可扩展到50W。
2、Xe HP(高性能):用于主流和发烧消费市场、数据中心和AI领域,典型功耗75-250W。
3、Xe HPC(高性能计算):用于超级计算机等,功耗暂无具体数值但基本不会有什么限制。
Intel首席架构师Raja Koduri透露,Xe GPU最初只设计了LP、HP两个微架构,后来发现HPC领域也有很大的机遇,就增加了一个,也是这次介绍的重点,可以打造百亿亿次超算平台,比如美国能源部旗下的“极光”(Aurora)就用了它和未来的10nm可扩展至强。
Raja还声称,Xe HPC可以扩展到多达1000个EU执行单元,而且每个单元都是全新设计的,FP64双精度浮点计算能力是现在的40倍。
Xe HPC架构中,EU单元对外通过XEMF(Xe Memory Fabric)总线连接HBM高带宽显存,同时集成大容量的一致性缓存“Rambo”,CPU和GPU均可访问,并借此将多个GPU连接在一起,提供极致的显存带宽和FP64浮点性能,且支持显存/缓存ECC纠错、至强级RAS。
封装方面,EMIB用于连接GPU与HBM,Foveros则用于互连Rambo缓存,由多个GPU在同一中介层上共享。二者都会大大提升带宽效率和密度。
Xe HPC将采用Intel 7nm工艺制造,官方称新工艺会加入EUV极紫外光刻技术,相比于10nm晶体管密度翻番,同时设计规则复杂度只有四分之一,而且规划了跨节点工艺优化,也就是会有更好的7nm+、7nm++。
当然,Intel早就说了第一款Xe显卡会是10nm工艺,只是这次没有给出更具体的消息,估计会在明年先推出10nm工艺、面向主流和发烧游戏市场的产品,后年再拿出7nm工艺、面向数据中心和高性能计算的版本。