首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 数据库 > 其他数据库 >

《Redis源码学习札记》RDB

2013-10-15 
《Redis源码学习笔记》RDB《Redis源码学习笔记》文章列表由于图片较大,缩放较为模糊,请双击打开查看原图 ^_^在

《Redis源码学习笔记》RDB
《Redis源码学习笔记》文章列表

由于图片较大,缩放较为模糊,请双击打开查看原图 ^_^

在主从复制过程中,我们提到过RDB文件,作为Redis持久化方式之一,RDB把数据库某一时刻的内容,也就是快照,以二进制的方式记录到文件,并且在下次启动的时候可以用来初始化Redis;

RDB最重要的两个过程是rdbSave和rdbLoad,下面我就这两个过程分别叙述;

rdbSave
在具体看rdbSave过程之前,我们先看下RDB文件格式:



我们可以简单思考下,RDB文件协议为什么会那样设计?
1. RDB文件以"REDIS"开头是为了区分普通文件,这样redis在加载的时候,读取前五个字节就可以判断该文件是否为一个合法的RDB文件;
2. 写明RDB文件版本是因为不同版本之间有一定差异性,根据版本号需要保持向下兼容;
3. 以数据库为单位,存入键值对,因为一个redis实例中,可以包含16个数据库,所以一定要标明该键值对属于哪个数据库,否则无法还原到相应位置;
4. 在写入键值对信息时,超时时间是可选的,标明值类型(value-type)是为了在加载的时候知道这是一个string,还是list或者hashtable;

rdbSave过程就是把redis每一个数据库中的键值对按照上面定义的格式写入文件,伪代码:

def rdbSave(filename):    # 创建临时文件,用于保存rdb数据    tempFile = createTempFile()    rio = rioInitWithFile(tempFile)    # ----------------------------------    # 1.保存RDB文件版本    rdbSaveVersion(rio, "REDIS" + REDIS_RDB_VERSION)    # 2.保存redis所有数据库中的键值对    for db in redisServer.dbs:        # 记录键值对所在数据库        rdbSaveSelectDB(rio, db.num)        # 保存该数据库中所有键值对        for key, val in db.getKeyValuePairs():            expired_time = getExpiredTime(key)            rdbSaveKeyValuePair(rio, key, val, expired_time)    # 3.写入RDB文件结束符    rdbSaveEOF(rio, REDIS_RDB_OPCODE_EOF)    # 4.写入校验和    rdbSaveCkSum(rio)        # ----------------------------------    # 确认数据都被flush到磁盘    fsync()    rename(tempFile, filename)    def rdbSaveKeyValuePair(rio, key, val, expired_time):    if expired_time != -1:        # 过滤过期键        if expired_time < now_time:            return        rdbSaveMillisecondTime(rio, expired_time)    # 保存值类型(list? string? hashtable?)    rdbSaveValueType(rio, val)    # 保存键    rdbSaveKey(rio, key)    # 保存值    rdbSaveValue(rio, val)

更多细节请看:rdb.c/rdbSave函数

触发rdbSave过程,主要有4种方式:
1. SAVE命令
2. BGSAVE命令
3. master接收到slave发来的sync命令
4. 定时save(配置文件中制定)

第一种情况,Redis保存RDB文件是在主进程中进行,所以在这其间,Redis无法响应客户端请求(再次强调:Redis是单线程Server);第二种情况,Redis fork出一个子进程,然后在子进程中进行rdbSave,因此也就不会阻塞主进程对客户端请求的处理;第三种情况和第四种情况同第二种情况,也是在子进程中进行;

rdbLoad
rdbload过程就比较简单了,它会按照RDB文件协议,把键值对还原到相应的数据库,伪代码:
def rdbLoad(filename):    rio =  rioInitWithFile(filename);    # 设置标记:    # a. 服务器状态:rdb_loading = 1    # b. 载入时间:loading_start_time = now_time    # c. 载入大小:loading_total_bytes = filename.size    startLoading(rio)    # ------------------------------------------    # 1.检查该文件是否为RDB文件(即文件开头前5个字符是否为"REDIS")    if !checkRDBHeader(rio):        redislog("error, Wrong signature trying to load DB from file")         return    # 2.检查当前RDB文件版本是否兼容(向下兼容)    if !checkRDBVersion(rio):         redislog("error, Can't handle RDB format version")         return    # 3.读取文件内容,加载键值对    while not end_of_file:        # 每循环一千次就处理一下客户端请求        if loops % 1000  == 0:            processClientRequest()        key, val, expired_time, dbnum = rdbLoadKeyValuePair()        # 过滤过期键        if expired_time != -1 and expired_time <= now_time:             continue        redisServer.db[dbnum].dict.add(key,value)        if expired_time > now_time            redisServer.db[dbnum].expires.add(key, expired_time)        loops = loops + 1    # 4. 校验和    if (!checkCkSum()): return    # ------------------------------------------    # 更新标记:rdb_loading = 0    stopLoading()

触发rdbLoad过程,主要有两种方式:
1. Redis启动时候的初始化;
2. slave接收到master发来的RDB文件;

总结:
1. 了解RDB文件格式;
2. 了解rdbSave和rdbLoad过程以及触发条件;



热点排行