Prodigy T16128:全球首颗通用处理器现世,绝绝子!!
扫描二维码
随时随地手机看文章
处理器将是下述内容的主要介绍对象,通过这篇文章,小编希望大家可以对Tachyum推出的处理器的相关情况以及信息有所认识和了解,详细内容如下。
2016年成立的硅谷芯片公司Tachyum近日发布了一颗神奇的处理器,拥有超多核心、超高频率,功耗却非常低。
这颗处理器名为“Prodigy T16128”,号称全球第一颗“通用处理器”(universal processor),在单一硅片内集成了通用处理器、HPC高性能计算、AI人工智能、DML深度机器学习、可解释人工智能(Explainable AI)、生物人工智能(Bio AI)等不同模块,可简化编程模型和环境。
它拥有多达128个核心,64位,乱序执行,每时钟周期4个指令,每个核心有两个1024位矢量单元、一个4096位矩阵单元,支持虚拟化和高级RAS。
具体架构没披露,不知道是ARM、MIPS还是自研,但强调除了原生指令集,也可以跑x86、ARM、RISC-V,简直全能。
更惊人的是频率,可以轻松超过5GHz,最高达到5.7GHz。
官方宣称HPC算力90TFlops(每秒90万亿次),AI训练和推理算力高达12PFlops(每秒1.2亿亿次),相当于NVIDIA A100的2.4倍,并支持各种数据类型如FP64、FP32、TF32、BF16、Int8、FP8、TAI。
缓存具备64KB一级数据、64KB一级指令、128MB二三级,都支持ECC。
内存支持16通道的DDR5,最高频率7200MHz,单路最大容量8TB。
扩展链接支持64条PCIe 5.0,还有两个400G以太网接口。
制造工艺是5nm(估计台积电),64×84mm FCLGA封装,不算很庞大。
它还支持双路、四路并行,四路的话就是512核心、32TB DDR5内存、256条PCIe 5.0。
官方宣称,该处理器性能优于Intel至强(没有具体对比型号),但功耗仅有十分之一,单位性能售价也只有三分之一。
如果不需要128核心,同时也会有64核心的T864、32核心的T832不同版本,其他规格也有所简化。
Tachyum 将 Prodigy 称为世界上第一个“通用处理器”,并表示它从一开始就被设计为能够运行众多世界上最密集的计算应用程序的多用途 CPU。Prodigy 不仅在单个芯片上处理所有这些不同的任务,而且它的功耗预算比传统硬件低10 倍,成本只有三分之一。
Tachyum 大胆宣称 Prodigy 超级计算机芯片的性能是市场上英特尔最快的 Xeon芯片的四倍,在高性能计算应用中的原始性能是Nvidia 的 H100的三倍。同时,能效提高 10 倍。
Tachyum 表示,为了在单核架构中创造如此令人印象深刻的性能,它从头开始构建了具有矩阵和矢量处理能力的 Prodigy,而不是事后才考虑它们。Prodigy 支持一系列数据类型,包括 FP64、FP32、TF32、BF16、Int8、FP8 和 TAI,所有这些都来自各个 CPU 内核本身。
Prodigy 处理器在 2023 年问世时可能会改变游戏规则。AMD、英特尔和 Nvidia 的最新服务器硬件都依赖于单个硬件——即使在单个 CPU 或 GPU 中——来执行这些不同的工作负载。这方面的一个例子是 Nvidia 的 RTX 系列 GPU ,它需要专用的机器学习 Tensor 核心才能让 AI 工作,而专用的 RT 核心则需要用于光线追踪应用程序。
另一方面,Prodigy 将能够在单个内核上运行 光线追踪 和 AI 应用程序,并且不需要将数据转移到微处理器内部的另一个芯片上。
在单个芯片内运行所有这些不同的 HPC 工作负载可能会极大地改变服务器格局:公司将能够将更多芯片打包到服务器场中,同时降低功耗和冷却。
Prodigy T16128 采用未知来源的 5nm 工艺技术运行,并在非常小的(就其提供的功率而言)64 mm x 84mm FCLGA 封装内运行。
Tachyum 表示,在 HPC 工作负载方面,该芯片能够执行12 AI PetaFLOPS 和 90 TeraFLOPS。Prodigy芯片还可以运行适用于 x86、ARM、RISC-V 和 ISA 的二进制文件。从某种角度来看,单个 Nvidia A100 只能实现 5 AI PetaFLOPS。
每个内核特别能够执行 2 个 1024 位向量单元、4096 位矩阵运算和每个时钟 4 个乱序指令。还支持虚拟化和高级 RAS。该芯片还包括超过 128MB 的具有纠错功能的 L2+L3 高速缓存。为了满足其所有内核的需求,该芯片配备了 16 个 DDR5 内存控制器,额定速度高达 7200MT/s,每个插槽的最大容量为 8TB。
T16128 是 Tachyum Prodigy 系列中的旗舰型号,产品堆栈中的中端和入门级插槽分别由 64 核 T864 和 32 核 T832填充。生产将于2023 年开始,因此我们应该会在明年某个时候看到这些芯片的实际基准。
以上便是小编此次想要和大家共同分享的内容,如果你对本文内容感到满意,不妨持续关注我们网站哟。最后,十分感谢大家的阅读,have a nice day!