媲美50万台PC!一组动图看懂华为全球最快AI训练集群Atlas 900
扫描二维码
随时随地手机看文章
9月18日,华为发布了前全球最快的AI训练集群Atlas 900,可将原本需要耗时数月的工作缩短到几秒钟。
Atlas 900集群采用目前算力最强的AI处理器华为昇腾910,数千颗互联,每颗都有32个达芬奇自主架构AI核心,整个集群的FP16半精度浮点算力达到256-1024PFlops,也就是秒钟25.6-102.4亿亿次计算!这足以相当于50万台PC的计算能力。
根据实测,它只需59.8秒钟即可完成基于ImageNet数据集训练ResNet-50模型,而竞品最快也要超过70秒。
作为大型集群网络,Atlas 900整合了三种高速互联方式,包括单端口速率240Gbps的华为自研HCCS片间互联、最新的PCIe 4.0、100G RoCE以太网,同时进行了系统级调优,HCCL通信库+网络拓扑+训练算法实现线性度大于80%。
超高的算力对于系统功耗、散热也是极大的考验,Atlas 900采用了业界顶尖的散热系统,尤其是业界最强的柜级密闭绝热技术,液冷占比超过95%,可大幅减少对外散热,同时高效节能,单液冷柜支持50千瓦的超高散热功耗。
华为Atlas 90可广泛应用于科学研究、商业创新,比如在天文领域,正在帮助国际组织SKA探索更广阔的宇宙空间,此外在自动驾驶、气象预测、石油勘探等特定领域也能大展拳脚。