redis可以说是除MySQL之外用的最多的一种数据库了!众所周知,它是一个非关系型数据库(NoSQL),当然它的出现也绝不是为了取代MySQL。非关系型数据库有很多种类型:面向列的NoSQL、基于图的NoSQL、文档型NoSQL ...... Redis是一种Key-Value型的NoSQL。Redis所有的key(键)都是字符串。我们在谈基础数据结构时,讨论的是value(值)的数据类型,主要包括常见的5种数据类型,分别是:String、List、Set、Zset、Hash。
一、String
数据结构
String是Redis最基本的类型,你可以理解成与Memcached一模一样的类型,一个Key对应一个Value。String类型是二进制安全的。意味着Redis的String可以包含任何数据。比如jpg图片或者序列化的对象。String类型是Redis最基本的数据类型,Redis中一个String类型的Value最多可以是512M。
String的数据结构为简单动态字符串(SimpleDynamicString,缩写SDS)。是可以修改的字符串,内部结构实现上类似于JAVA的ArrayList,采用预分配冗余空间的方式来减少内存的频繁分配。
常用命令
使用场景
缓存:经典使用场景,把常用信息,字符串,图片或者视频等信息放到Redis中,Redis作为缓存层,MySQL做持久化层,降低MySQL的读写压力
计数器:Redis是单线程模型,一个命令执行完才会执行下一个,同时数据可以一步落地到其他的数据源。
Session:常见方案Spring Session + Redis实现Session共享。
字符串的Encoding有三种方式:
embstr对别raw的优点:
二、List
数据结构
Redis 列表是简单的字符串列表,按照插入顺序排序。你可以添加一个元素到列表的头部(左边)或者尾部(右边)。它的底层实际是个双向链表,这意味着List的插入和删除操作效率会比较快,时间复杂度是O(1)。使用List结构,我们可以轻松地实现最新消息排队功能,List的另一个应用就是消息队列,可以利用List的 PUSH 操作,将任务存放在List中,然后工作线程再用 POP 操作将任务取出进行执行。
常用命令
使用场景
redisObject如何表示List
列表对象List的编码方式encoding有两种,分别是:Ziplist(压缩列表)、Linkedlist。
Ziplist:
优点:节省内存
缺点:比其他结构要消耗跟多的时间,所以Redis在数据量少的时候使用压缩列表储存。列表元素数量少于512,并且所有元素的长度都少于64字节时,使用Ziplist(压缩列表)储存,相反会使用Linkedlist。
Ziplist节省内存的原理:
普通数据能够支持随机访问的原因是储存的内存是连续的,但是有一个问题,就是数组中每一个元素的大小都是必须相同的,如果大小不一样的话,那么该元素的内存就必须按照数组中最大的元素(假设是五个字节)的内存存放,那么储存少于5个字节的元素就会存在内存浪费问题。
Linkedlist:
列表元素数量少于512,并且所有元素的长度都少于64字节时,使用Ziplist(压缩列表)储存,相反会使用LindedList。
三、Set
数据结构
Redis Set对外提供的功能与List类似是一个列表的功能,特殊之处在于Set是可以自动排重的,当你需要存储一个列表数据,又不希望出现重复数据时,Set是一个很好的选择,并且Set提供了判断某个成员是否在一个Set集合内的重要接口,这个也是List所不能提供的。Redis的Set是String类型的无序集合。它底层其实是一个Value为Null的Hash表,所以添加,删除,查找的复杂度都是O(1)。一个算法,随着数据的增加,执行时间的长短,如果是O(1),数据增加,查找数据的时间不变。
常用命令
使用场景
推荐:通过sinter命令计算交集,比如美团给你推荐附近外卖时就可以根据你的外卖记录与附近商家计算交集推送安全提示:微信群成员保存在一个set中,用户好友也保存在Set中。当用户加入群聊时可以提醒非好友用户注意安全。
编码格式
Set集合值set 的encoding编码方式有:intset、hashtable。
intset:当 集合的长度少于 512 时,并且所有元素都是整数,使用 intset存储。否则使用 hashtable。
Hashtable:Hashtable编码的底层实现是字典,字典的每个键是字符串对象,只不过值都是空(NULL)。
四、Hash
数据结构
Redis hash 是一个键值对集合。Redis hash是一个string类型的field和value的映射表,hash特别适合用于存储对象。类似Java里面的Map<String,Object>。
以用户ID为查找的key为例,存储的value用户对象包含姓名,年龄,生日等信息,若用普通的key/value结构来存储。
每次修改用户的某个属性需要,先反序列化改好后再序列化回去。开销较大。
用户ID数据冗余。
通过 key(用户ID) + field(属性标签) 就可以操作对应属性数据了,既不需要重复存储数据,也不会带来序列化和并发修改控制的问题。
常用命令
使用场景
商品对象、用户对象。这个场景需要验证性对待,如果商品对象、用户对象信息每次都需要全量的话不妨存string,但是仅仅部分使用就可以考虑使用hash结构SKU等信息,这个场景hash就比较合适了。一个hash结构中存储某个商品所有sku。
编码格式
Hash 的Encoding 编码方式共有两种:Ziplist、Hashtable
Ziplist:当哈希对象保存的键值对数量少于512,且所有键值对的长度都少于64字节时,使用压缩列表保存。在压缩列表中,每当有新的键值对要加入到哈希对象时, 程序会先将保存了 键的压缩列表节点 推入到压缩列表表尾, 然后再将 保存了值的压缩列表节点 推入到压缩列表表尾, 因此:保存了同一键值对的两个节点总是紧挨在一起。
Hashtable:若哈希对象保存的键值对个数大于512,并且其中有键值对大于64个字节,就使用Hashtable 保存。
五、sorted set
数据结构
Redis有序集合Zset与普通集合Set非常相似,是一个没有重复元素的字符串集合。不同之处是有序集合的每个成员都关联了一个评分(score),这个评分(score)被用来按照从最低分到最高分的方式排序集合中的成员。集合的成员是唯一的,但是评分是可以重复的 。因为元素是有序的, 所以你也可以很快的根据评分(score)或者次序(position)来获取一个范围的元素。访问有序集合的中间元素也是非常快的,因此你能够使用有序集合作为一个没有重复成员的智能列表。
Zset是Redis提供的一个非常特别的数据结构,一方面它等价于Java的数据结构Map<String, Double>,可以给每一个元素value赋予一个权重score,另一方面它又类似于TreeSet,内部的元素会按照权重score进行排序,可以得到每个元素的名次,还可以通过score的范围来获取元素的列表。
Zset底层使用了两个数据结构:
举个例子:在有序链表和跳跃表中,查询出51。
有序链表:
要查找值为51的元素,需要从第一个元素开始依次查找、比较才能找到。共需要6次比较。
跳跃表:
从第2层开始,1节点比51节点小,向后比较。21节点比51节点小,继续向后比较,后面就是NULL了,所以从21节点向下到第1层在第1层,41节点比51节点小,继续向后,61节点比51节点大,所以从41向下在第0层,51节点为要查找的节点,节点被找到,共查找4次。从此可以看出跳跃表比有序链表效率要高。
常用命令
使用场景
排行榜:美团要做一个销量排行榜,就可以使用店家的订单做score,这个查询出来的结果就是有序的权重队列:score作为优先级,这样取出来的数据权重都是最大优先执行的延时任务score作为任务启动执行时间,取值时判断该值执行即可。
编码格式
Zset的Encoding 编码有两种,分别是:Ziplist、Skiplist。
Ziplist:与Hash有异曲同工之妙,都是使用相邻两个节点存储Score和Memberskiplist。
Skiplist:redis 的 Skiplist 是由字典Dict 和 跳表构成的。
总结
在开发中,字符串类型是用的最多的数据类型,导致我们忽视了redis的其他四种数据类型,在具体场景下选择具体的数据类型对提升redis性能有非常大的帮助。redis虽然支持消息队列的实现,但是并不支持ack。所以redis实现的消息队列不能保证消息的可靠性,除非自己实现消息确认机制,不过这非常麻烦,所以如果是重要的消息还是推荐使用专门的消息队列去做。