redis五种数据类型对象的实现及场景分析

on__the__way

浏览: 23988 次
性别:
来自: 北京

最近访客更多访客>>

lth365519212

拓子轩

zhu_xuyin

zm1024

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

redis学习笔记

1，redis对象的结构

type记录了对象的类型，可以使字符串，列表，哈希，集合和有序集合对象。

encoding记录的是type对象对应的底层实现，在redis中每种类型只有少两种底层实现的数据结构。通过不同的编码方式是redis可以根据不同的使用场景来选择不同的实现方式。同时不同编码在满足条件时会触发转换。

ptr是指向底层实现数据结构的指针。

2，字符串

字符串对象是使用最广泛的类型，如memcache中的kv的v相似。也是redis其他数据类型嵌套使用的对象类型。有三种编码方式：int、raw、embstr三种。

a, raw编码方式

字符串对象是大于39字节的字符串时则私用raw编码方式存储，即SDS。

b, smbstr编码方式

smbstr编码方式是专门保存短字符产的一种编码方式，与raw相似，但会调用一次内存分配函数申请redisobject和sdshdr，连续存储。但它是只读的，当对它修改时类型转换为raw编码方式。

c, int编码方式

ptr指向一个整数，当对已int编码方式编码的字符串对象进行append等操作时，会类型转换为sds类型。

d, 可进行的操作

在使用命令INCR系列（ INCR, DECR, INCRBY）命令时将字符串作为的原子计数器。

使用APPEND命令追加字符串。

将字符串作为GETRANGE 和 SETRANGE的随机访问向量。

在小空间里编码大量数据, 或者使用 GETBIT 和 SETBIT创建一个Redis支持的Bloom过滤器。

e, 场景

String是最常用的一种数据类型，普通的key/value存储都可以归为此类，value其实不仅是String，
也可以是数字。

3，列表

Redis列表是简单的字符串列表，按照插入顺序排序。你可以添加一个元素导列表的头部（左边）或者尾部（右边） LPUSH 命令插入一个新的元素导头部, 而 RPUSH插入一个新元素导尾部.

redis的列表有两种实现方式ziplist和linkedlist，

a, ziplist编码方式

当元素数目小于512个并且每个元素的长度都小于64个字节时使用该编码方式。当插入的元素不满足上述条件则转换为linkedlist编码。

b, linkedlist是双端链表的实现

c, 场景分析

实现最新消息排行等功能。
Lists的另一个应用就是消息队列，可以利用Lists的PUSH操作，将任务存在Lists中，然后工作线程再用POP操作将任务取出进行执行。

从时间复杂度的角度来看Redis列表的主要特征是在头和尾的元素插入和删除是固定时间，即便是数以百万计的插入。. 在列表的两端访问元素是非常快的但是如果你试着访问一个非常大的列表的中间的元素是很慢的，因为那是一个O(N)操作。因此list不支持判断某个key是否在列表中这一命令。

4，哈希

在类似memcache中，结构化的信息打包成 hashmap，在客户端序列化后存储为一个字符串的值（一般是 JSON 格式），比如用户的昵称、年龄、性别、积分等。这时候在需要修改其中某一项时，通常需要将字符串（JSON）取出来，然后进行反序列化，修改某一项的值，再序列化成字符串（JSON）存储回去。操作复杂、也不便于更新修改操作，并发情况。hash完美解决。两种编码方式，ziplist和dict，一个ziplist存放了一个key对应的结构化数据。

a, ziplist编码方式

类似于列表，档大小和数量不满足时也会转换为dict编码。

b, dict编码

这里k和v都是字符串对象

c, 场景分析

存储、读取、修改用户的结构化数据

5，集合

Redis 集合（Set）是一个无序不重复的字符串集合. 你可以以O(1)的时间复杂度 (无论集合中有多少元素时间复杂度都是常量)完成添加，删除，以及测试元素是否存在。有两种编码方式intset和hashtable。

a, inset编码方式

所有元素都保存在整数集合中

b, 场景分析

多次添加相同的元素，最终在集合里只会有一个元素。因此在添加元素的时候无须检测元素是否存在。

一个Redis集合支持一些服务端的命令从现有的集合出发去进行集合运算，求交集、并集、差集

set 的内部实现是一个 value永远为null的HashMap，实际就是通过计算hash的方式来快速排重的，不同于list，可以实现检查某一key是否在set中，因为底层是hashtable，常量复杂度。

实际应用如计算独立ip，微博共同好友，好友推荐等

6，有序集合

有序集合是将集合中的元素增加了一个权重参数 score，使得集合中的元素能够按 score 进行有序排列，集合的成员是唯一的，但是评分可以是重复了。有序集合使用ziplist和skiplist+dict两种编码方式。

a, ziplist方式

第一个节点保存元素成员，相邻第二个节点保存score，编码方式类似于哈希的ziplist编码方式。

b, skiplist+dict编码方式

zset结构同时包含一个字典和一个跳跃表，skiplist保存了分支从小到大的所有元素，由于跳跃表的查找复杂度较高，因此使用dict结构存成员和分值，查找复杂度为O(1)，而而zrank和zrange命令式则使用skiplist进行范围操作。

c, 场景分析

排行榜相关，使用ZADD命令去更新它，使用 ZRANGE命令来得到前多少名的用户，,使用ZRANK命令返回该用户的名词。同时使用ZRANK 和 ZRANGE 可以显示和给定用户分数相同的所有用户。

来做带权重的队列，如普通消息的score为1，重要消息的score为2，然后工作线程可以选择按score的倒序来获取工作任务。让重要的任务优先执行。

score设为过期时间，需要精准设定过期时间，定期清除过期的数据。

使用有序集合你可以以非常快的速度（O(log(N))）添加，删除和更新元素。因为元素是有序的, 可以很快的根据评分或者次序来获取一个范围的元素。访问有序集合的中间元素也是非常快的,因此你能够使用有序集合作为一个没有重复成员的智能列表。在有序集合中，可以很快捷的访问一切需要的东西：有序的元素，快速的存在性测试，快速访问集合的中间元素。