华为首次发布计算战略:全球最快AI训练集群面世
扫描二维码
随时随地手机看文章
9月18日,在第四届HUAWEI CONNECT 2019(华为全联接大会),在本次大会上,中国工程院院士、鹏城实验室主任高文院士,分享了鹏城实验室与华为的合作,力求共同打造中国首个动态进化的E级AI超算系统,构建新一代人工智能基础研究创新平台。华为云业务总裁郑叶来,则从商业应用的角度,基于华为云在10多个行业、500多个项目的实践,指出行业AI正在跨越商用裂谷,成为重塑企业数字化转型的关键驱动。
华为首次发布计算战略,基于架构创新、投资全场景处理器族、有所为有所不为的商业策略、构建开放生态进行布局。同时,华为重磅发布了全球最快AI训练集群Atlas 900,加速科学研究与商业创新的智能化进程。
华为首次发布计算战略
华为副董事长胡厚崑表示,“我们面临的是一个2万亿美元的计算产业大蓝海,华为坚定不移地投入计算产业,通过对架构创新的突破、对全场景处理器的投资、坚持有所为有所不为的商业策略,以及构建开放生态来布局战略。”
第一,架构创新。投资基础研究,推出达芬奇架构,用创新的处理器架构来匹配算力的增速。
第二,投资全场景处理器族,包括面向通用计算的鲲鹏系列,面向AI计算的昇腾系列,面向智能终端的麒麟系列,以及面向智慧屏的鸿鹄系列等。
第三,有所为有所不为的商业策略。华为不直接对外销售处理器,以云服务面向客户,以部件为主面向合作伙伴,优先支持合作伙伴发展整机。
第四,构建开放生态。未来5年,继续投入15亿美元,汇聚500万开发者,使能全球合作伙伴开发应用及解决方案。
Atlas 900创造全新世界纪录
这款产品汇聚了华为十多年的技术沉淀,在衡量AI计算能力的金标准ResNet-50图片分类模型下,Atlas 900只需59.8秒就完成了训练,在同等精度下比原来的世界纪录快10秒。 “ ImageNet-1k数据集”包含128万张图片,精度为75.9%,在同等精度下,其他两家业界主流厂家测试成绩分别是70.2s和76.8s,Atlas 900 AI训练集群比第2名快15%。
据了解,Atlas 900 AI集群主要为大型数据集神经网络训练提供超强算力,可广泛应用于科学研究与商业创新,让研究人员更快地进行图像、视频和语音等AI模型训练,让人类更高效地探索宇宙奥秘、预测天气、勘探石油和加速自动驾驶的商用进程。
Atlas 900 AI集群也可以提供云服务,以云的方式提供充裕的、经济的算力资源,简单易用、高效率、全流程的AI平台,为客户带来极致体验的“易获取、用得起、方便用”的普惠AI算力。为了让各行各业获取超强算力,华为将Atlas 900部署到云上,推出华为云EI集群服务,并以极优惠的价格,面向全球科研机构和大学,即刻开放申请使用。
“这是计算产业新的大航海时代,我们期待的是千帆竞发,而不是独舟奋进。我们期望和各行各业的伙伴共同努力,抓住历史机遇,共创智能新高度。” 胡厚崑最后强调。
Atlas 900 代表当今全球
算力巅峰
此次发布的Atlas 900 AI训练集群由数千颗昇腾910 AI处理器互联构成,是当前全球最快的AI训练集群,代表了当今全球的算力巅峰。其总算力达到256P~1024P FLOPS @FP16,相当于50万台PC的计算能力。
除了昇腾910带来的高性能外,Atlas 900还有四大亮点。
其一是AI算力业界领先。Atlas 900 AI训练集群采用业界单芯片算力最强的昇腾910 AI处理器,每颗昇腾910 AI处理器内置32个达芬奇AI Core,单芯片提供比业界高一倍的算力。
其二是最佳集群网络。Atlas 900 AI训练集群采用“HCCS、 PCIe 4.0、100G以太”三类高速互联方式,百TB全互联无阻塞专属参数同步网络,降低网络时延,梯度同步时延缩短10~70%。独创iLossless 智能无损交换算法,对集群内的网络流量进行实时的学习训练,实现网络0丢包与E2E μs级时延。
其三是系统级调优。Atlas 900 AI训练集群通过华为集合通信库和作业调度平台,整合HCCS、 PCIe 4.0 和100G RoCE三种高速接口,充分释放昇腾910 AI处理器的强大性能。华为集合通信库提供训练网络所需的分布式并行库,通信库+网络拓扑+训练算法进行系统级调优,实现集群线性度>80%,极大提升了作业调度效率。
其四是极致散热系统。传统数据中心多以风冷技术对设备进行散热,但在人工智能时代传统数据中心却面临非常大的挑战。Atlas 900 AI训练集群采用全液冷方案,创新性设计业界最强柜级密闭绝热技术,支撑>95%液冷占比。单机柜支持高达50kW超高散热功耗,实现PUE<1.1的极致数据中心能源效率。极致的液冷散热技术满足了高功率、高密设备部署、低PUE的需求,极大地降低了客户的TCO。
计算是人类认知世界的一种模式。从大型机到个人计算机,从智能手机到可穿戴设备,计算能力日益成为人类能力的延伸。同时,计算模式也在不断演进,基于统计的计算模式将逐渐成为主流。预计5年后,AI计算所消耗的算力,将占到算力消耗总量的80%以上,计算正在进入一个新的智能时代。