借助电源完整性测试提高人工智能数据中心的能效
扫描二维码
随时随地手机看文章
数据中心正在部署基于人工智能(AI)的技术,处理器密集型服务器正在推动能源需求的增长,下表说明了这种发展趋势所带来的巨大影响。国际能源署(IEA)预测,到2030年,数据中心的耗电量将占全球耗电量的7%,相当于印度全国的耗电量。
图1:数据中心CPU和GPU技术的功耗
由于电力需求不断增长,关注能源效率至关重要。泰克与知名电源完整性专家Steve Sandler合作,开发了出色的测量技术,旨在改进下一代人工智能数据中心的运营效率/能效。
提高电源分配网络(PDN)的能效提高供电网络(PDN)的能源效率
PDN必须为驱动服务器机架中的GPU敏感负载提供许多低噪声直流电源轨。追求更高速度和更高密度意味着,需要在更低电压水平和更大电流下实现更快边缘速率、更高频率和更多轨道。这突显了良好电源完整性的重要性。
进行电源完整性测试的目的是,验证到达负载点(POL)的电压和电流在所有预期运行条件下是否满足负载的电源轨规格要求。要在千兆赫频率下准确测量毫伏级电源轨噪声,尤其需要注意。
让我们通过基于的服务器系统的电源分配网络高能级结构图,了解如何评估PDN性能。
图2:数据中心的高能级配电网络
如图所示,典型数据中心通过12V、24V或48V直流电源为其基于AI的服务器供电,然后在主板上将电压转换为其他电源电压。工程师能够查看从电源输出到FPGA、处理器和其他复杂IC的链路中的每个环节,因此可以将电源轨阻抗控制在非常低的水平,以便输送由GPU技术驱动的AI服务器所需的高电流。阻抗管理的棘手之处在于配电网络由许多阻抗组成,包括电压调节器、去耦电容器和PCB走线。高速交换和热插拔服务器卡会引入意外的阻抗变化,这可能导致过多的瞬变或噪声。
要确保稳定节能的设计,首先要最大限度地减少PDN中的噪声。电源轨噪声规格可以达到数百兆赫或数千兆赫的频率范围,其幅度达到毫伏级。
评估能效首先要对交流线路输入和输出进行电能质量测量,以确保线电压和线电流符合要求。用于评估质量的测量值如下所示:
● 频率
● 有效电压和电流
● 有效值
● 阻抗阻抗
● 波峰因数(电压和电流)
● 有功功率、无功功率和视在功率真实功率、无功功率和视在功率
● 功率因数和相位功率因数和相位
为了确保准确进行这些测量,示波器探头的选择非常重要;使用差分探头测量系统的线电压,使用电流探头测量系统的线电流。
另一个关键测量是对PDN控制环路响应进行频率响应分析。这将提供有关控制环路速度和电源稳定性的重要信息。借助波特图查看分析结果,图3中是示例设置。
图3:电源分配网络阻抗的测量设置
电源完整性探测系统应受重视电源完整性探测系统值得关注
当今示波器配备的高阻抗10X无源探头可能具有足够的带宽,但会使您想要测量的噪声信号发生衰减。1X探头可无衰减地传递噪声信号,但其带宽仅为几百兆赫。具有50Ω输入阻抗的传输线探头或电缆具有出色的高频性能,但在直流情况下会产生显著负载,除非增加直流隔离器。衰减传输线探头产生的负载较小,同时保持低噪声和高带宽。
电源轨探头是另一类低噪声探头,偏移范围高达4GHz,直流偏移范围为-60至+60 Vdc。在识别噪声源方面,电源轨探头是一种比传统无源探头更准确的替代工具,如下图4所示。根据电源轨的电压,可能需要直流阻断器。如果需要,请确保直流阻断器为示波器提供浪涌保护,并且不受直流或交流偏置的影响。电源轨探头虽然能够测量很小的噪声,但也是单端测量。因此,需要使用能够进一步减少测量接地环路误差的同轴隔离器。Picotest提供多种直流阻断器和同轴隔离器来满足此类需求。详细了解终极电源轨噪声测量。
图4:使用无源探头(下方迹线)和电源轨探头(上方迹线)的电源线纹波测量比较
快速低噪声采集与超快速边缘负载相结合,可模拟AI级处理器工作负载,从而可以准确评估PDN设计中的电源轨噪声电压以及电源轨与电源轨之间的串扰。在结合使用泰克5 B rId11 MSO或6 B rId12 MSO示波器的情况下,Picotest提供了完整的负载设备系列,最高为2,000安培、1纳秒的边缘负载,并支持高达65Ms/s的采样率,以进行精确的模拟实验。(见图5)快速、低噪声采集与超快边缘负载相结合,可模拟AI级处理器工作负载;允许准确评估PDN设计中的电源轨噪声电压和电源轨到电源轨串扰。与泰克5系列B MSO或6系列B MSO示波器结合使用;Picotest提供高达2,000安培、1ns边缘负载的完整负载系列,支持高达65MS/s的采样率,以实现精确的仿真工作。(见图5)
图5:显示了对AI级处理器进行伪随机高幅度负载的特性分析
使用Picotest负载设备进行特性分析,并通过泰克6系列B MSO示波器进行测量,可以确保特性分析的准确性。泰克6系列B MSO示波器是捕获低噪声、高分辨率信号的理想仪器。
示波器测量分析有助于节省时间并减少错误
识别和分析PDN中的故障点可能耗费时间。在电源分配网络中寻找纹波、过冲、欠冲、开启、关闭、时间趋势、稳定时间和抖动信号是一项复杂的任务。值得庆幸的是,当今大多数现代示波器都提供了内置分析软件,用于设置仪器和自动执行信号采集和显示。下方为波纹自动测量示例。将这些特性内置到仪器中,再加上具备通过远程PC进行自动化的功能,可以简化大型团队的AI性能评估工作,同时,还可以评估AI支持性能随时间和温度的变化情况,以测试服务器的效率和耐久性。
图6:自动纹波测量,并在5系列B MSO示波器显示屏的右侧显示注释结果
总结
由于人工智能(AI)推动下一代数据中心的能源需求增长,评估电源分配网络(PDN)的性能和效率变得比以往任何时候都更加重要。采用良好的PDN测试和测量策略,将会使AI就绪数据中心达到最佳运行性能、可靠性和能效,登录https://www.picotest.com/solutions/tektronix/,了解更多详情:6系列B MSO | Tektronix。
关于泰克科技
泰克公司总部位于美国俄勒冈州毕佛顿市,致力提供创新、精确、操作简便的测试、测量和监测解决方案,解决各种问题,释放洞察力,推动创新能力。70多年来,泰克一直走在数字时代前沿。欢迎加入我们的创新之旅,敬请登录:tek.com.cn。