其他数据库 2023-06-12

数据结构深入浅出Redis源码中KV数据结构（redis源码kv）

Redis是一个基于键值（KV）对存储的内存数据库。KV数据结构是Redis中最重要的数据结构之一，也是其高性能和高可用性的关键所在。在这篇文章中，我们将深入浅出Redis源码中的KV数据结构，分析其实现原理和优化技巧。

Redis中的KV数据结构简介

在Redis中，每个键都对应着一个值。这个键值对就是Redis的核心数据结构之一。而这个KV对的实现方式，正是Redis最为基本的数据结构之一——字典。

Redis的字典采用哈希表作为实现方式，它根据给定的键计算出对应的哈希值，并在哈希表中寻找该键对应的哈希表节点。哈希表节点包含了三个属性：key（存储键）、value（存储值）和next（指向下一个哈希表节点）。

Redis的字典实现非常高效，它可以快速地根据键获取对应的值，并且支持高并发。在Redis中，可以通过下列API来操作字典：

dictCreate()                // 创建一个新的字典
dictAdd()                   // 向字典中添加一个新的键值对
dictFind()                  // 根据键查找其对应的哈希表节点
dictDelete()                // 从字典中删除指定的键值对
dictResize()                // 对字典进行扩容或缩容
dictIterator()              // 新建字典的迭代器
dictReleaseIterator()       // 释放字典的迭代器

深入分析Redis KV数据结构的源码实现

现在我们来看一下Redis实现KV数据结构的关键代码。

字典节点的结构体

为了在哈希表中存储键值对，Redis定义了一个dictEntry结构体，该结构体中包含指向key和value的指针，并且包含了指向下一个节点的指针。

typedef struct dictEntry {
    void *key;                  // 键值
    union {
        void *val;              // 键对应的值
        uint64_t u64;           // 64位无符号整型
        int64_t s64;            // 64位有符号整型
        double d;               // 双精度浮点型
    } v;
    struct dictEntry *next;     // 指向下一个节点的指针
} dictEntry;

字典结构体

Redis的哈希表通过字典结构体来组织节点。该结构体定义了一些指向哈希表节点的指针，以及一些表示哈希表容量和大小的参数。

typedef struct dictht {
    dictEntry **table;          // 哈希表节点数组
    unsigned long size;         // 哈希表大小
    unsigned long sizemask;     // 哈希表大小掩码
    unsigned long used;         // 已经使用的节点数目
} dictht;

typedef struct dict {
    dictType *type;             // 特定类型函数接口
    void *privdata;             // 私有数据
    dictht ht[2];               // 两张哈希表，ht[0]：平时使用，ht[1]：扩容时使用
    long rehashidx;             // 扩容时使用，rehash进度记录，数据移动时的当前下标（从0开始）
    unsigned long iterators;    // 迭代器数目
} dict;

哈希表结构体

哈希表结构体 dictht定义了哈希表的桶数组，以及记录哈希表统计信息的一些参数。哈希表大小必须为2的幂次方，这样就可以通过 &(size-1)掩码来快速地计算出元素在哈希表中的下标了。

dict结构体定义了两个 dictht类型的哈希表，ht[0]代表平时使用的哈希表，ht[1]则代表扩容时使用的哈希表。在扩容时，新插入的键值对会被插入到ht[1]中，同时从ht[0]中移动数据到ht[1]中。

哈希表的扩容和缩容

哈希表的大小不足或过大都会对字典的效率产生影响。因此，Redis提供了对哈希表进行扩容和缩容的API，这是Redis哈希表高性能和高可用性的重要保障。

扩容主要是对哈希表的大小(size)进行一倍的扩展，同时将哈希表中的所有键值对重新分配到新的哈希表中。而在缩容过程中，Redis并不会立即释放删除的哈希表节点，而是将其设置为FREED状态，等待下一次扩容时被回收。

// 将字典的大小适应键值对的数量，以便达到给定的load factor 目标
static int _dictExpandIfNeeded(dict *ht)
{
    if (ht->size == 0)
        return dictExpand(ht, DICT_HT_INITIAL_SIZE);
    if (ht->used == ht->size)
        return dictExpand(ht, ht->size * 2);
    return DICT_OK;
}
// 将哈希表大小扩大到大于或等于size，并保证哈希表空闲的结点空洞不会超过1
int dictExpand(dict *d, unsigned long size)
{
    dictht n; /* the new hash table */
    unsigned long realsize = _dictNextPower(size);

    /* 如果不是rehash阶段则哈希表数组为空，执行初始化 */
    if (dictIsRehashing(d)) return DICT_ERR;
    /* 初始化新的哈希表结构 */
    n.size = realsize;
    n.sizemask = realsize - 1;
    n.table = zcalloc(realsize * sizeof(dictEntry*));
    if (d->ht[0].table == NULL) {
        /* 表示当前哈希表为空，说明是首次调用创建哈希表 */
        d->ht[0] = n;
        return DICT_OK;
    }

    /* 如果正在rehash则将新哈希表用作ht[1]，并在下次rehash过程中使用它 */
    d->ht[1] = n;
    d->rehashidx = 0;
    return DICT_OK;
}

在Redis的实现中，每次扩容的大小为现有哈希表大小的两倍。当哈希表使用量达到总容量的50%时，就会自动触发哈希表的扩容操作。这样，即保证了哈希表的空间不会过多浪费，也保证了性能的高效。

Redis中的KV数据结构是其高性能和高可用性的核心所在。其基于哈希表实现的KV数据结构，不仅支持高效的键值查找和更新操作，并且更是基于扩容/缩容机制实现了高可用的保障。随着Redis应用场景的不断增多，其KV数据结构的优化也将面对更多的挑战。对于一个优秀的Redis开发者来说，对于KV的深入认识是必备的基本素养。

数据运维技术 » 数据结构深入浅出Redis源码中KV数据结构（redis源码kv）

分享到：

相关推荐