RAID内存:回写技术和热插拔容量技术
扫描二维码
随时随地手机看文章
本内容总结了工作中RAID内存的经验教训。下面分别介绍了在HP的热插拔技术中应用到的两个小技术,它们就是回写(Scrubbing)技术和热插拔容量(Hot-Plug Capabilities)技术。
回写技术
HP热插拔RAID内存提供了一个回写硬件方式,它可以确认ECC或RAID检查出来的软错误。HP技术尝试定位于在读内存时检查出来所有软错误,方法是把改正后的正确的数据写回内存中去。但此方法不适用于硬错误。
回写技术可以阻止软错误的累积,避免发生更严重的错误。它降低了ECC的工作量,提高了系统的性能。一些传统的系统采用的是软件回写,HP热插拔RAID内存使用硬件完成这个工作。
HP热插拔RAID内存会对错误生成错误日志,错误极限由软件设定。当记录的错误值达到错误极限的时候,软件会自动做出反应。例如,当超过错误极限的时候故障灯会自动亮,这就是由软件控制的。
热插拔容量(Hot-Plug Capabilities)技术
HP热插拔RAID内存还允许用户在不关闭服务器电源的情况下在线更换、在线扩展及在线升级DIMM,这就是HP的热插拔容量技术。
在线更换是指在系统运行的情况下更换出现故障的DIMM。HP热插拔RAID内存不需要操作系统的支持,服务器在购买的时候就具有支持在线更换的能力。在线扩展指用户在空的插槽上插入DIMM以扩展系统容量。在线升级是指用户用容量更大的DIMM替代旧的较小容量的DIMM。在线扩展和在线升级都可以使用户获得更大的系统内存容量。在线扩展和在线升级要求操作系统的支持,系统要认出新增的内存。
当在线内存操作完成后,如果工作在热插拔RAID内存模式下,那么系统会自动在所有的内存盒中重新放置数据(rebuild)。虽然这样做会暂时降低内存的工作性能(重新放置4 GB的数据花费的时间少于30s),但是只需要花费很少的钱就可以提高容错能力,并可避免系统检修期间带来的经济损失。