平头哥首款SSD主控芯片,不止存力强大这么简单!
扫描二维码
随时随地手机看文章
近年来,以AI、云计算等新兴技术为代表的数字化转型引发了一系列数据爆炸。这一趋势不仅让海量数据存储的重要性日益凸显,同时也推动着海量数据存储加速走向变革。
为了满足云服务器和企业服务器等数据中心的存储需求,今天(11月1日)阿里旗下半导体公司“平头哥”宣布,其自主研发的首款SSD主控芯片“镇岳510”正式发布。
▲平头哥发布首款SSD主控芯片“镇岳510”
▌多重技术加持,构建先进数据存力
SSD主控芯片是一种具有独立智能控制功能的集成电路,主要负责主机交互、协议解析与执行、数据调度、后台任务等。作为固态硬盘中的核心器件,SSD主控芯片在国内外都拥有着强劲的市场需求。
根据市场研究机构Maximize Market Research的数据显示,2022年全球SSD市场规模为243.6亿美元,预计到2029年复合年增长率达14.31%。另据《中国存力白皮书(2023年)》统计,2022年全国存力总规模(5年计量)达到1000EB,较2021年增长25%。
尽管这一领域长期被Marvell、三星等国际厂商所垄断,但近年来,随着国家对数据安全自主可控的重视程度不断增加,国产SSD也开始逐渐崭露头角,而平头哥就是其中的代表企业之一。
▲图片来源:Maximize Market Research
对于SSD来说,一款主控芯片的好坏将直接决定了固态硬盘的实际体验和使用寿命;而不同架构、核心/晶体管数量的多少、频率的高低,则关乎着主控的整体性能。那么,此次平头哥发布的镇岳510,其性能与可靠性又如何呢?
据平头哥SSD产品负责人周冠锋介绍,镇岳510在硬件架构、算法等方面都是平头哥自研,在核心指标上处于业界领先地位。
“镇岳510每秒可处理高达340万笔IO。一枚镇岳510的性能,相当于1万块高性能HDD的性能总和。此外,镇岳510还拥有极高的能效比,每瓦功耗可提供42万笔IO访问。”周冠锋补充道。
▲平头哥SSD产品负责人周冠锋
以一个部署10万块SSD的数据中心为例,相比目前主流的PCIe 4.0SSD,镇岳510在相同的性能下,仅主控芯片即每年节省260万度电,按照一度电排放0.785千克二氧化碳计算,每年可减少二氧化碳排放2千吨。
在实际应用方面,镇岳510内置创新的IO自动化处理机制,前端IO解析与处理,由专用硬件模块自动完成,实现了业界领先的超低的时延(4μs),可以带给应用极佳的体验,比业界SSD降低30%以上。不仅如此,镇岳510芯片内还实现了IO/SYS/GC的全链路隔离,极大地降低了这些任务之间的相互干扰,提供了既低又稳定的时延表现。
值得一提的是,镇岳510还内置了平头哥自研的高性能LDPC纠错算法,编码效率逼近香农极限,同时ErrorFlow相比业内SSD更优一个数量级。另外,借助平头哥自研闪存电压预测算法,还可以在各种闪存的不同工况、寿命、温度等条件下,准确预测闪存电压漂移,进一步降低LDPC解码器的输入误码率。
“基于这些技术优势,镇岳510实现了低至10^-18的UBER,这相当于每读取百亿亿笔数据,才可能有一笔数据纠错失败。”周冠锋如是说。
▌为云计算定制,打造极致存储体验
镇岳510不仅具备更强存力、更高可靠等特点,还能通过为云定制,带来更优秀的存储体验。
在谈及定制化方案时,周冠锋表示,在传统的系统方案中,SSD与存储系统分离设计。SSD负责底层闪存数据排布,但无存储语义而无法达到最佳排布;SSD负责后台任务,但无法判断最佳启停时机;而存储系统有存储语义却无法排布闪存数据,有最佳时机却无法启停SSD后台任务。上下的割裂给整个存储系统的性能与寿命带来了额外消耗,这被称为“SSD接口税”。
因此,ZNS协议被发展出来,通过将盘内FTL层上移至存储系统,达到了存储系统与闪存特性的完美匹配,消减了“SSD接口税”。2021年5月,ZNS协议被收入NVMe规范2.0版本中,并得到了SPDK、Linux以及各设备商的支持。
此次发布的镇岳510则完美地实现了ZNS协议,通过灵活的硬件表项加速保持了高IO性能,而Zone分区状态则交由玄铁910维护,保留了对新协议的灵活性。此外,镇岳510还定制了Last Sector随机写功能,实现了小报文的多次反复下盘,简化了ZNS的应用难度。
据了解,数据请求可以分为带宽敏感型与时延敏感型,不同的请求应予以不同的处理策略,才能达到业务最佳SLA。NVMe规范中制定了以队列为粒度的标准SQ调度机制,但其灵活性较差,对于业务种类复杂、追求灵活可配的云存储系统来说,它并不是最佳选择。
“而镇岳510在支持NVMe标准的SQ调度机制的同时,额外定制了基于IO粒度的优先级调度机制,允许系统按IO打标,优先级种类多达8级,结合云存储系统,能够更好的保障延迟敏感型业务的服务质量。”周冠锋进一步介绍道。
云存储系统的完整数据链路,从计算端开始,通过网络到存储服务器,再通过内部互联到达SSD。为了保障数据的高可靠,全链路应采用语义一致的完整性校验。但NVMe规范只规定了以Sector为单位按照T10 DIF/DIX的校验机制,与存储系统的语义并不相同,因此SSD的校验与存储系统的校验产生了差异。
镇岳510以IO为粒度,遵循上层存储语义进行校验,补齐了整个存储系统的数据链路校验的最后一环。不仅如此,镇岳510还支持以存储语义对内部数据进行后台巡检,而无需再读出至服务器,从而节省了宝贵的PCIe带宽、服务器内存带宽与CPU算力。
总之,镇岳510可以更好地满足云上业务迅猛发展所带来的存力需求,非常适用于大数据分析、在线交易和在线分析,以及高性能数据库等场景。凭借上述功能的增强和性能的提升,可以预见,镇岳510将会重新定义未来数据存力。