SAS Switch 技术之基本部署
扫描二维码
随时随地手机看文章
设想你公司有成百上千的决策,管理人员,他们工作中需要通过交换信息,彼此商量来进行紧密配合,你可能会选择把公司办公总部安排在如上海陆家嘴这样的市中心地点。虽然地价昂贵,但是便利的地点让公司能及时高效地运行。又设想你公司有大量的货品需要存放转运,那公司的货品的仓库多半会选择在远郊靠近机场码头地地方,地价便宜,转运方便。
在设计计算机系统时,人们却还注意到地价的概念。而简单地认为CPU, 内存,磁盘都是对等的计算机部件。其实地价在计算机系统中也是寸土寸金。简单来说,越靠近CPU,能提供的I/O联接就越高速,廉价,低延迟,因此靠近CPU的物理空间价值就越高,而离CPU远的空间,物理空间的价值就越低。依次概念,数据中心的外部存储,可类比为地处远郊的数据“仓库”。
典型的刀片服务器中地价的概念就十分突出。通常刀片服务器由一个具有高速互连背板的多槽位机框为系统的基础。通常机框都价格不菲。通常厂家都会提供不同配置的CPU刀片(服务器结点),存储刀片(多盘位JBOD),和交换刀片供用户选择。不需对具体产品价格做计算,我们光是考虑到刀片服务器的昂贵地价,就可做如下的简单结论:
1)CPU刀片上最好不要有磁盘,同样的宝贵空间,配置多些个CPU, 内存条,通常会更合理。
2)存储刀片也最好避免购买,同样的宝贵槽位,不如留给更有价值的CPU/交换刀片使用。
3)外部连接个JBOD来提供整个刀片服务器所有CPU所需要的存储空间,既经济,又便于扩容。
在大型数据中心的硬件系统中,同样的地价因素也在起作用。下图说明,通过减少每个结点的磁盘数目,可以把服务器的密度成倍提高。从1U位置容纳单个结点,提升为1U2,还可进一步提升为1U3, 1U4。目前业界的最高密度大致每机架可容纳160个服务器结点,共320个CPU, 比传统的机架密度提升了4倍以上。
效率的提升,除了在物理空间的更充分利用之外,还合适的封装边界内带来了设备共享的机会,比如Facebook 的4个结点,就可共享同一个以太网卡,PMC+Intel RSA的参考设计中,可在4太服务器结点中共享若干个NVMe SSD。因为当这些结点被高密度地封装在1U的空间中,就可能通过便宜的PCB连接实现PCIe的高速互连来实现设备的共享,而不会引入昂贵的额外线缆成本。
在天蝎2.0机架中,合作厂商已实现了插入机架的SAS Switch, JBOD等具体产品,因此搭建一个基于SAS Switch的存储方案已经是十分易行:
有了这样的物理构架,如何在一个机架上优化资源使用效率呢?具体来说,部署机架前如何决定要配置多少服务器结点,多少JBOD呢?简单来说,这个问题的答案在于具体应用的资源配比特性,其中最重要的一个就是CPU和盘的数目比例。可通过对应用的性能评测来计算这个配比的范围,来决定设备的最初部署比例,而在部署后的长期运行过程中,还个就每个CPU的动态运行状态来进行动态优化。
流程如下:
依次基本方法,可在企业和数据中心中部署SAS Switch技术。