全球训练速度最快集群Atlas900曝光 华为计算产业战略全公布
扫描二维码
随时随地手机看文章
华为全联接大会主论坛门前的展示牌
9月18日,一年一度的华为全联接大会在世博会展馆开幕,主论坛前“AI巅峰,即将揭晓”的展示牌昭示本届大会的主题,更彰显着华为的野心与底气。
去年的全联接大会上,华为首次对外发布其AI发展战略以及全栈全场景AI解决方案,两款AI芯片昇腾910和310也吸引了不少关注,今年是华为AI战略的延续,华为副董事长、轮值董事长胡厚崑主要从两方面做阐述:
算力目前仍然是人工智能产业的基础——大会发布了华为的计算产业战略;
从技术和应用场景出发人工智能产业更新——大会分享了华为全栈全场景AI重大进展;
胡厚崑率先开场做主题为《共创智能新高度》的演讲,他提到,华为过去半年顶着巨大的压力,但华为目前的状态还不错,“如上海的天气,秋高气爽,云淡风轻”。
胡厚崑表示,智能世界的两大关键技术,联接和计算同样重要,相互促进,密不可分,华为在计算方面的投入超过十年。
华为观察到,计算机的体积越来越小,功能越来越强大,更重要地,计算机和人的距离越来越近,计算能力已经成为人的能力的一种延伸,沿着这样的趋势走下去,华为相信计算产业的发展前景是不可限量的。
计算模式本身也在不断演进,从1960年代基于规则的计算,以CPU为代表,到2010年代基于统计的计算,以NPU为代表,而未来,华为预测,基于统计的计算将会成为计算主流,消耗的算力有可能占据社会总算力的80%。
“计算正进入智能时代”,胡厚崑表示,计算进入智能时代有三个特征,其一,基于统计的计算就是一种“暴力计算”,高度依赖算力;
其二,计算和智能将会无处不在,而不仅仅是分布在中心侧。从中心节点的暴力计算,到边缘侧的专业计算,如基因测序,以及端侧的个性计算,如耳机、手机,一起构成了未来智能时代的计算形态;
其三,端边云协同,从中心侧到边缘侧到端侧,边端云需要更好的协同,在华为看来,中心节点主要负责暴力计算,通用模型在中心节点计算完之后,复制到边和端,为端侧的个性化计算和边缘侧的专业化计算提供支持。
“未来十年是计算产业黄金十年,虽然有很多困难,但也是巨大的新蓝海。”
华为计算产业战略正式发布:架构创新、投资全场景处理器族、商业策略“有所为有所不为”、构建开放生态。
架构创新:达芬奇架构胡厚崑提到,在摩尔定律几乎已经走到极限的情况下,行业需要新架构,达芬奇架构诞生是自然选择,到目前为止,达芬奇计算架构是业界唯一能够覆盖“端、边、云”全场景的处理器架构。
投资全场景处理器族:鲲鹏、昇腾、麒麟、鸿鹄华为目前的处理器族已有四族,具体包括支持通用计算的鲲鹏系列,支持AI的昇腾系列,支持智能终端的麒麟系列,以及支持智慧屏的鸿鹄系列。胡厚崑表示,华为未来将持续不断地对处理器进行投资,将来还将推出一系列处理器,面向更多的场景。
商业策略“有所为有所不为”首先是硬件开放,不对外销售处理器,主要以云服务方式,开放部件和板卡等,全力支持合作伙伴做好整机。
然后是软件开源,华为将于硬件搭配的服务器操作系统、数据库、AI开发框架等软件开源,帮助伙伴做好商用版本,让软件开发更简单。
最后是使能应用开发和迁移,华为不做应用但是会帮助合作伙伴做应用的开发和迁移。
构建开放生态:沃土计划延续计算产业的发展高度依赖生态。自华为沃土计划发布后,四年来发展得非常好,目前已汇聚130多万开发者和14000多家ISV。新一轮计划投入15亿美元资金,希望扩大到500万开发者规模。
在通用计算领域,华为投资鲲鹏系列希望打造有竞争力的通用计算处理器。在此基础上,华为不断地对板卡、服务器、操作系统、数据库、编译器等关键技术和产品进行投资,希望通过强力投资,打通生态全链条,让合作伙伴更有信心、更坚定地参与打造鲲鹏产业。
在全国范围内,鲲鹏产业生态基地已经落地北京、上海、深圳等城市。华为与各地的政府、合作伙伴一起,结合当地的优势,打造鲲鹏计算产业的创新基地和孵化平台。以平台为载体,聚合生态伙伴,开展应用示范,培养产业人才,孵化产业标准。
全栈全场景AI重大进展
去年的全栈全场景解决方案发布,但是只有部分落地,也引起了开发者和合作伙伴的担忧,今年则是全面落地。
现场进一步发布了华为AI全栈全场景重磅产品——昇腾910服务器集群Atlas900,华为称之为目前世界上训练速度最快的训练集群,在Fastest cluster ResNst-50@ImageNet测试中,华为成绩为59.8秒,比第二名70.2秒的成绩高出了10秒多。
Atlas900由数千颗昇腾910 AI处理器互联构成,每颗昇腾910 AI处理器内置32个达芬奇AI Core,单芯片提供比业界高一倍的算力(256TFLOPS@FP16),总算力达到256P~1024P FLOPS @FP16。
Atlas 900 AI训练集群采用“HCCS、 PCIe 4.0、100G以太”三类高速互联方式,在AI服务器内部,昇腾910 AI处理器之间通过HCCS高速总线互联;昇腾910 AI处理器和CPU之间以最新的PCIe 4.0(速率16Gb/s)技术互联,其速率是业界主流采用的PCIe 3.0(8.0Gb/s)技术的两倍;在集群层面,采用面向数据中心的CloudEngine 8800系列交换机,提供单端口100Gbps的交换速率。
Atlas 900 AI训练集群采用全液冷方案,支撑>95%液冷占比。单机柜支持高达50kW超高散热功耗,实现PUE<1.1的极致数据中心能源效率。另外,在空间节省方面,与8kw风冷机柜相比,节省机房空间79%。
华为现场介绍了天文案例,天文研究高度依赖于海量的数据分析和计算,离不开超强算力支持。
华为联合上海天文台与SKA共同打造的,一张南半球的星空图有20万颗星星,当前条件下,天文学家要从这20万颗星星中,找出某种特征的星体,相当困难,需要169天的工作量。现在用上Atlas 900,只用10秒,就从20万颗星星中检索出了相应特征的星体。
胡厚崑在现场宣布,为了让大家马上就能用上Atlas 900的超强算力,华为已经把它部署到华为云上,并以极优惠的价格向全球科研机构和大学开放,欢迎大家申请使用。
在发言的最后,胡厚崑表示,华为选择了计算架构和处理器的开发这两个最难的方面入手,他提到,华为的基因是,愿意且善于走远路的公司,用最好的技术解决最难的问题。
“我们坚信,只有克服最大的困难,才能真正构建起竞争力,才能为行业伙伴打开更大的产业空间,我们要用最好的技术,解决世界上最难的问题,把不可能变成可能。这是计算产业新的大航海时代,我们期待的是千帆竞发,而不是独舟奋进。我们期望和各行各业的伙伴共同努力,抓住历史机遇,共创智能新高度“,胡厚崑代表华为发出了产业强音。记者记者(公众号:记者)记者
相关文章:
华为方舟编译器正式开源,脱离 GitHub 实现自主托管
华为发布首款旗舰5G SoC麒麟990,强大AI性能支持摄像头测心率
华为鲲鹏产业生态创新中心落户上海