当前位置:首页 > 公众号精选 > 架构师社区
[导读]这是一个纷杂而无规则的世界,越想忘掉的事情,越难忘记。      正文  Redis本身内容繁杂,要是上来就研究一细节点,如连接池、数据结构,虽可直接学到某个点的详尽源码内容,甚至尽快解决一些事故,但容易溺死在细节汪洋,无法整体把控Redis。最好是先建立起“架构”。想精通Red...


这是一个纷杂而无规则的世界,越想忘掉的事情,越难忘记。

     

   正文   


Redis本身内容繁杂,要是上来就研究一细节点,如连接池、数据结构,虽可直接学到某个点的详尽源码内容,甚至尽快解决一些事故,但容易溺死在细节汪洋,无法整体把控Redis。

最好是先建立起“架构”。想精通Redis,须能领略其总体架构,再深入具体技术点。

构造Redis 这种 KV DB,首要考虑:

  • 数据模型
    能存什么数据?如用户信息(用户ID、name、age、sex等),通常用 MySQL,在一个用户ID对应一个用户信息集合的场景下就是KV DB的据模型之一,也能满足这类存储需求。

  • 操作接口
    可以怎么数据?
    如计算多个用户的avg年龄,KV DB则无法胜任。因其只提供了简单的操作接口,并不支持复杂聚合计算。

所以,先搞懂数据模型和操作接口,才能物尽其用。


数据模型

KV DB,最基本数据模型就是KV模型。选型KV DB时,一大因素就是其支持的V类型:

  • Memcached仅支持String V类型

  • 而Redis支持的V类型还包括hash、list、set等

所以Redis能被更广泛应用。


对 crud boy来说,不同V类型就意味着能支持多种业务的数据需求。


操作接口

无论什么DB,基本操作都逃不开 crud:

  • PUT:新写入或更新一个KV对

  • GET:根据一个key读取相应的V值

  • DELETE:根据一个key删除整个KV对

  • SCAN操作:根据一段K范围,返回相应V值

内存 or 外存?

  • 在内存,读写快,百ns级。风险是一旦掉电,会丢失所有数据

  • 在外存,虽可避免数据丢失,但受限于磁盘慢速读写(几ms级别),KV DB整体性能会被拉低。

因此,需根据KV DB应用场景来选型。


如缓存场景下的数据需要能快速访问但允许丢失,则采用内存保存KV数据。


访问模式选型

  • 通过函数库调用供外部使用

    如libsimplekv.so,就是以动态链接库的形式链接到我们自己的程序,提供KV存储功能,如RocksDB。

  • 通过网络框架,以Socket通信对外提供KV对操作,可提供广泛的KV存储服务
    如Memcached和Redis。

通过网络框架提供KV存储服务:

  • 扩大了KV DB的生态

  • 给KV DB的性能、运行模型提供了不同选型,带来潜在问题


比如,当客户端发送如下命令,该命令会被封装在网络包中发送给KV DB:

PUT java edge
KV DB网络框架接收到网络包,并按照相应的协议进行解析后,可知客户端想写入一个键值对,并开始实际写入。


I/O模型设计
网络连接的处理、解析客户端的请求及数据存取的处理,应该选择怎样的线程模型?

  • 一个线程,既要处理网络连接、解析请求,又要完成数据存取,一旦某一步操作发生阻塞,整个线程就会阻塞住,这就降低了系统响应速度

  • 多线程处理不同操作,则某个线程被阻塞时,其他线程还能正常运行。但不同线程间如果需要访问共享资源,又会产生线程竞争,影响系统效率


所以,这里也还需精心设计。


KV对的定位

知道了要进行的KV对操作,就得查找所要操作的KV对是否存在,这就依赖KV DB的索引模块:让KV DB据key找到相应V的存储位置。


不同KV DB采用的索引:

  • Memcached、Redis采用哈希表

  • RocksDB采用跳表


一般内存KV DB(如Redis)采用哈希表作为索引,主要因其KV基本都保存在内存,而内存高性能随机访问特性与哈希表O(1)复杂度匹配。


Redis的V支持多种类型,当通过索引找到一个K所对应V,仍需从V的复杂结构(如set或list)中进一步找到想要数据,该操作的效率本身就依赖其实现结构。而Redis便采用一些高效的索引结构作为某些V类型的底层数据结构。


各操作的具体逻辑

不同操作找到V的存储位置后的操作:

  • GET/SCAN
    根据V的存储位置返回V值

  • PUT
    为该KV对分配内存空间

  • DELETE
    删除KV对,并释放内存空间,该过程由分配器完成


重启后快速提供服务

KV DB的KV对大小不一,分配器在处理随机的大小内存块分配时,表现不好的话,一旦KV对数据规模过大,可能导致严重内存碎片。

所以分配器是KV DB中的关键。对内存存储为主的Redis更重要。Redis的内存分配器提供了多种选择,分配效率也不同。

KV DB虽依赖内存保存数据,提供快速访问,但也希望KV DB重启后能快速重新提供服务,所以,在其存储模块增加持久化功能。


因为磁盘管理比内存管理复杂,KV DB直接采用文件形式,将KV数据通过调用本地文件系统的操作接口保存在磁盘。
此时,KV DB只需考虑何时将内存中的KV数据保存到文件:

  • 每个KV对都落盘保存,这虽然让数据更可靠,但每次都写盘,性能受大影响

  • 周期性把内存中的KV对保存到文件,避免频繁写盘。但数据有丢失风险


所以,Redis提供了持久化功能,还有多种执行机制和性能优化点。


KV DB - Redis 架构


本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
关闭
关闭