云数据库未来发展方向:云原生、一体化和多模输入
扫描二维码
随时随地手机看文章
在去年11月3日,阿里云原生数据库正式命名为“瑶池”数据库。彼时阿里巴巴集团副总裁、阿里云智能数据库产品事业部负责人李飞飞,向大家解析了“瑶池”这一命名的由来:“瑶池在古代是孕育八方宝藏的一个地方,各种各样的宝贝都会汇聚到瑶池这个地方。在今天我们所处的社会里面,数据我们认为是最大的宝藏。所以数据汇集的地方就是一个宝藏汇集的地方,所以我们把它叫做瑶池。数据到了瑶池里面,就能够发挥出更大的价值。我们也希望所有的用户所有的客户,能够像珍爱自己的宝贝一样,把自己最珍贵的数据,都放到阿里云数据库里面。”
而在今年5月24日,阿里云瑶池数据库峰会在北京成功召开,阿里云向生态伙伴分享了云原生数据库的最新技术积累和实践,如何帮助用户,将宝藏(数据)汇聚到瑶池中来,发挥出更大的价值。
云服务商的新机遇:新一代云上数据生态
云计算经过了多年的发展,已经成为了一个庞大的分布式计算体系。在这一体系中,云操作系统负责统筹管理和调度计算资源和数据,提供软硬件协同的计算服务。而数据库在整个云计算中至关重要,如何使用好数据、做好数据挖掘、赋能业务发展,是所有用户关心的话题。
Gartenr认为未来3~5年内,云服务数据库方面会有两个趋势。第一是数据重力(Data Gravity)效应将会凸显。从数据库服务商的角度来讲,就是强者愈强。有越多的数据库实力的部署,有越多的客户在使用,就能收获到越多越领先的客户的优质反馈,更多的客户反馈和营收也将会为数据分析、人工智能相关的技术研发带来更多投入。
第二个趋势是云上的数据库生态的形成。目前云上数据库的选择变多(Diversity of Choice),每个垂直领域都优质的数据库厂商在深耕。而数据库企业用户就面临着如何将更多的工具有机整合在一起,实现业务打通,实现每个工具高效运维的难题。而随着数据库厂商和云服务商合作的深入,Garten认为这种企业复杂的运维的工作将会逐渐被头部的高科技云服务商的服务所替代,通过“云上的数据生态”来帮助企业客户实现不同业务的数据库的打通和有机整合。
而所谓的云上的数据生态,具体例如实现数据库和硬件更好的兼容性;硬件的资源利用优化,达到极致的性能,数据分析和数据分析的产品之间实现更好的数据共享等等。阿里云智能首席技术官周靖人表示,当前云服务正处在一个变革期,如何把数据和云进一步整合,形成新一代云上的数据生态,对于云服务商而言是一个新的机遇。
在这一数据处理生态变革中,有几个明确的趋势。第一是要实现Serverless架构,通过云上操作系统来进行物理映射匹配。云原生数据库提供了传统数据库所不具备的高可用、高可靠弹性的能力,而Serverless会将这种能力进一步演进到一个新的时代。第二是要将广大的计算资源有机地融合到数据库系统中来,实现云上的弹性功能。第三是要数据库智能化,数据库本身能够利用AI的技术,优化数据相关AI分析能力。阿里云原生数据库也一直在这几个技术趋势方向上进行发展,李飞飞表示瑶池数据库将会汇聚各方的数据、多种类型的数据,让数据业务持续在线,让数据价值不断放大,让阿里云原生数据库变得更快、更稳、更安全、更好用。
定义云原生数据库的未来发展方向:一体化和多模输入
要实现数据库更快、更稳、更安全、更好用,阿里云认为云原生数据库要更快速地向“四化”去演进,即“原生化、平台化、一体化和智能化”。云原生是未来数据库的趋势,这已成为确定事实。单一的数据库产品将不会再有机会去创造未来的,一定要基于云去构建平台化的能力,打造软硬协同的自上到下全体系的创新,打造标准的API来支撑数据的无缝流动,避免数据孤岛。此外随着ChatGPT的出现,让业界看到了AIGC的可能性,智能和数据库的结合将迸发住无限的潜力。
阿里云在云原生数据库方面有三个核心产品,分别是AnalyticDB、PolarDB,以及云原生多模数据库Lindorm,这三个产品分别面向个不同的应用场景。PolarDB是阿里云从2017年开始自研核心云原生数据库,从其命名上可以看出其追求极致的产品定位,这也是阿里云的旗舰数据库产品。李飞飞表示,PolarDB已经开始定义云原生数据库的发展方向。
首先,PolarDB基于平台化做深基础的理念,结合阿里云的基础设施去做软硬协同。PolarDB提供基于SmartSSD智能硬盘的高压缩比,能够提供3倍常规压缩比和100%加密的能力,且对主机CPU不会产生任何影响,能够帮助客户大幅减少成本。
第二,PolarDB是业界第一个、全球范围内第一个首先实现三层解耦的云原生数据库,在存储计算分离的基础上,进一步将计算层的内存和CPU进行解耦,将内存进行池化。三层解耦的架构带来的好处是可以做到无感的秒级弹性,李飞飞表示可以“弹得更广,弹得更快,弹得更细”。大规模内存的池化也将带来成本下降,PolarDB可以将CPU利用率提高100%,内存成本降低50%,大查询的性能提高150%。
第三是在一体化的方向上,PolarDB讲提供云原生分布式一体化的能力。在此次峰会上,阿里云也重磅宣布,首次将云原生数据库PolarDB和云原生数据仓库AnalyticDB彻底打通融合,形成“云原生一体化”的HTAP解决方案。以后在PolarDB和ADB之间同步数据,再也不需要开发者搭配数据同步链路,阿里云通过逻辑复制、增量同步以及物理复制等技术,直接将数据库从存储层打通,实现统一入口的一站式体验。
除了云原生一体化外,另一个值得关注的是Lindorm数据库对于AIGC场景的智能化支持。Lindorm支持多模数据的输入和处理,例如用户导入多模数据模型之后,一键就可以自动基于文字描述形成不同的设计图片。Lindorm数据库将会成为AIGC时代的数据基础设施,成为AIGC应用中的利器。此外在数据库的人机交互方面,阿里云也带来了新的变革,通过自然语言进行问题描述,数据库就可以自动输出结果。这一技术叫做NL2SQL,将会进一步简化开发者和数据库的交互方式。
李飞飞表示,下半年PolarDB将会把NL2SQL技术正式产品化,结合Lindorm的AIGC的能力,相信阿里云数据库做好了拥抱智能时代的一切准备。
“拥抱云原生,拥抱开源”
开源和商业相结合的模式,能够实现更快速的生态发展和技术迈进。云原生数据库开源,可以使用户降低迁移成本;开源社区的贡献也能够让用户在底层适配做的更好。李飞飞表示,开源加速了人类文明科技演进的速度,这个非常非常重要,实际上最终所有人都会受益。但是这里面确实也要有一个挑战的问题,就是怎么平衡开源和商业之间的关系。开源能够加速科技创新,科技创新又带来更多价值创造,价值创造带来更多的机会反哺更多良性的循环,这是所有人都应该打造的一个闭环的生态。
20230328_6422b2c95f5c0__云数据库未来发展方向:云原生、一体化和多模输入