500w神卡!AMD Instinct MI250X/MI250计算卡曝光
扫描二维码
随时随地手机看文章
AMD CEO苏姿丰博士此前曾确认,会在明年发布基于下一代架构的全新计算卡,但未透露更多细节。
一直以来不断有曝料称,AMD CDNA2架构的全新计算卡代号Aldebaran(毕宿五),将命名为Instinct MI200,会采用MCM双芯整合封装设计。
根据大神@ExecutableFix的最新情报,AMD全新计算卡将有两款,分别叫Instinct MI250X、Instinct MI250,都基于Aldebaran GPU。
其中,MI250X将集成110个CU计算单元,并集成创记录的128GB HBM2e显存。
这不但是当前Instinct MI100 32GB HBM2的整整四倍,还远远超越竞品。——NVIDIA A100计算卡升级后集成80GB HBM2e,Intel Sapphire Rapids至强则会集成64GB HBM2e。
另外,MI250X的核心加速频率为1.7GHz,FP64双精度浮点性能47.9TFlops,FP32单精度浮点性能95.8TFlops,FP16/BF16半精度浮点性能383TFlops,对比目前的MI100分别提升大约3.1倍、3.1倍、2.1倍。
不过代价也比较大,尽管采用了7nm工艺,但是整卡的热设计功耗依然高达500W,增加了足足三分之二。
至于MI250,应该是MI250X的低端版本,或屏蔽部分核心,并降低频率。
此前,高性能计算企业Pawsey SuperComputing透露,他们正在为澳大利亚打造一台算力高达50PFlops(5亿亿次每秒)的超级计算机“Setonix”(澳洲短尾矮袋鼠),主要用于大数据方面的研究工作。
配置方面,这台超算计划配备超过20万个AMD Milan霄龙处理器核心,如果是顶级64核心型号那就是3000多颗处理器,同时搭配750多块AMD MI-Next计算卡用于加速计算,而每块计算卡拥有128GB显存,另外还有至少548TB系统内存、2.7PB SSD硬盘。
MI-Next这里指的自然就是多次曝光的Instinct MI200,代号Aldebaran,CDNA2架构,MCM双芯封装,预计128个计算单元。
就在日前,MI200的内核架构图曝光,显示内部确实有两个Die,总共8个显存控制器,都是8通道,每通道支持2GB HBM2/HBM2e显存,最大容量正好就是128GB。
前还不确认MI200的具体显存类型,估计大概率和NVIDIA一样也是最新的HBM2e,带宽预计可达大约2TB/s。
相比之下,AMD现有的CDNA架构Instinct MI100计算卡的显存是32GB HBM2,带宽为1.23TB/s。
AMD去年11月发布了基于全新CDNA计算架构的Instinct MI100,而今随着游戏卡机构从RDNA2挺进RDNA3,新的CDNA2架构也在路上,对应产品就是Instinct MI200,代号为“Aldebaran”(毕宿五)。
CDNA2的设计和RDNA3有一点相通,那就是都会采用MCM多芯封装方式,内部同时集成两个Die,核心规模轻松翻番,预计共有16384个流处理器核心,MI100则只有7680个。
显存方面,MI100配备了32GB HBM2,带宽高达1.23TB/s,MI200则会猛增到128GB,创下全新纪录,而且升级为新一代的HBM2e,带宽能突破2TB/s。
AMD MI200将搭配下一代霄龙处理器,构建全球首个百亿亿次超算Frontier,预计今年底推出,还会有不少其他中小型超算采纳,比如澳大利亚的Setonix。
初代CDNA架构的计算卡名为Instinct MI100,代号“Arcturus”(大角星),7nm工艺,120个计算单元,8192个核心,实际开启7680个,搭配4096-bit 32GB HBM2,功耗300W。
CDNA2架构的预计名为Instinct MI200,代号“Aldebaran”(毕宿五),首次采用双芯整合封装,也就是两个GCD,可能有110个或220个计算单元,搭配128GB HBM2e。
消费级的RNA3架构,也会采用类似的整合封装。
AMD ROCm开发者工具更新也曝光了MI200的四个不同设备ID,分别是0x7408、0x740C、0x740F、0x7410,看起来对应四款不同型号。
CDNA3架构的自然应该是Instinct MI300,还没有代号,如果还是沿用红巨星、红超巨星的名字,那应该是更大的“Rigel”,也就是参宿七/猎户座β。
更大的还有“Antares”,即心宿二/天蝎座α,以及“Betalgeuse”,即参宿四/猎户座α。
但传闻称,MI300将会配备四颗芯片,也就是四个GCD,如此一来理论上核心规模可以再次翻番。
MI300应该会在明年底发布,届时将正面竞争Intel Xe HPC架构的Ponte Vecchio、NVIDIA Hopper架构的H100。
CDNA3架构如此设计,RDNA4架构应该也会类似,到时候我们就能看到四芯整合封装的顶级游戏卡了
这次发布了MI250X/MI250计算卡,真的封神了