当前位置:首页 > 芯闻号 > 产业动态
[导读]北京2022年4月18日 /美通社/ -- 4月9日-13日,第十三届国际性能工程学大会(ICPE2022)在线召开,大会由国际计算机协会ACM和标准性能评估组织SPEC联合举办,高效能服务器和存储技术国家重点实验室承办。此次大会吸引了300余位专家、学者报名参与,共收到各类投稿...

北京2022年4月18日 /美通社/ -- 4月9日-13日,第十三届国际性能工程学大会(ICPE2022)在线召开,大会由国际计算机协会ACM和标准性能评估组织SPEC联合举办,高效能服务器和存储技术国家重点实验室承办。此次大会吸引了300余位专家、学者报名参与,共收到各类投稿290余篇,涉及AI建模及算法、算力提升、能效测量、新型计算架构、体系结构研究等多个主题。其中专业论文70余篇,包含优秀论文58篇,论文集收录22篇。会议期间还举办了6场专题研讨会,涵盖基准测试、存储管理、软件开发等多个领域。

浪潮参加第十三届国际性能工程学大会 以性能优化应对数据挑战


首次引入数据挑战专题,评估数据算法优化对服务器性能的提升情况

相对于传统应用来讲,在云、边、AI等新兴领域,数据中心的首要性能挑战主要来自不断增长的数据规模,系统内的数据流动制约了大规模、超大规模系统计算的效能,提高了系统部署及维护的复杂度和成本。根据国际权威机构Statista的统计和预测,2020年全球数据产生量预计达到47ZB,而到2035年这一数字将达到2142ZB。数据挑战带来的直观问题是超大规模系统的协同,即如何解决数据流动、系统模块之间的通信问题。为此,ICPE2022首次引入数据挑战专题,针对数据集形成算法并进行优化,同时优化服务器的性能。

来自沃尔茨堡大学的André Bauer教授介绍了一种性能改变点的自动分类方法,通过应用时间序列分析和机器学习方法,开发一个可以对潜在的性能变化点进行分类的模型,以评估不同机器学习模型的性能,并将生成的模型应用于其他未标记的数据集,以自动对性能变化点进行分类和检测,从而节省人力及设备资源,提升部署速度。

专家分享研究实践成果,从边缘到集群的性能优化

在大会Keynote演讲环节,来自维也纳理工大学、谷歌及浪潮信息的三位演讲嘉宾,分别从边缘故障预测、数据中心管理、多层数据访问优化的角度介绍了应对数据挑战所采取的方案。

维也纳理工大学教授Ivona Brandic(IEEE 云计算杂志、IEEE TPDS 和 IEEE TCC 编委),在题为《面向可持续和容错边缘系统的数据科学驱动方法》演讲中,揭示了边缘系统与物联网相结合的挑战:由于时效性、高度异构性和资源稀缺,云计算或通用分布式系统设计的故障恢复机制无法应用于边缘系统。因此,Ivona Brandic和她的团队设计了一种基于机器学习的新机制,可以评估在边缘基础设施上冗余部署的服务故障恢复能力。该方法利用动态贝叶斯网络(dbn)的概念,学习边缘服务器故障之间的时空相关性,并将其与拓扑信息相结合,以合并链路故障。最后,可推断出在服务运行时,某一组服务器发生故障或并发断开连接的概率。 

SOSP、FAST、EuroSys和HotCloud的程序委员会主席,John Wilkes,长期从事谷歌计算基础设施集群管理工作,发表主题为《构建仓库规模的计算机》的演讲,他介绍谷歌内部面对几个月内增加100000 个 CPU 内核 + RAM + 闪存 + 加速器 + 磁盘的需求,可以动态地将资源分配给最迫切需要它们的产品组,准确地反映所有机器和基础设施的成本(运营支出/资本支出),并监控、控制数据中心的电源和冷却系统以实现最小的开销。

浪潮信息人工智能与高性能应用软件部高性能应用架构师,李龙翔博士发表主题为《多层数据访问优化》的演讲。随着近年CPU核心数增加及性能的不断增强,在超大规模系统并行计算时,越来越多的应用运行性能主要受数据访问速度限制。针对超大规模集群的数据存储特点,他介绍了一种多层数据访问 (Multi-Layered Data Access,MLDA) 优化方法,可以快速对超大规模并行计算性能瓶颈进行分析,通过对存储、网络、访存、CPU等设备数据访问过程优化,提升超大规模集群并行计算效率。这只是浪潮信息解决超大规模系统挑战多种技术之一,在中文巨量模型"源1.0"的训练过程中,浪潮信息采用了多种面向超大规模并行计算技术的软硬件协同优化手段,通过流水线并行、张量并行等手段自动地将模型多层数据切分到不同的节点中实现并行。"源1.0"模型包含的参数总量达 2457 亿,是 GPT-3 的 1.404 倍。

除主题演讲之外,分论坛内容同样精彩

学术论文获奖者,来自犹他大学的Richard Li表示,对于基于分布式微服务的应用程序来说,性能故障排除是出了名的困难。分析人员对性能异常的典型根源诊断首先是缩小慢速服务的范围,调查慢速组件中的高级性能指标或可用日志,最后深入到实际原因。由于缺乏领域知识和实际操作经验,这个过程可能会很长、很乏味,有时还会漫无目的。在本次大会中,他介绍了一种新的由机器学习驱动的性能分析系统,该系统可自动化与延迟相关的性能异常的故障排除过程,以方便诊断和解释根本原因。

来自于IBM的Lixiang Luo为本次大会的产业论文获奖者,他提出的三种NVMe存储虚拟化方法(PCI设备直通法、虚拟块设备法和SPDK虚拟主机目标法)通过虚拟机提供NVMe存储,同一主机上的多个虚拟机可以共用一个物理NVMe设备,以满足现代工作负载不断增长的I/O吞吐量和延迟需求。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭