一文读懂 Redis 缓存系统

时间：2023-09-21 11:32:29 来源：作者：誉天教育

本文介绍了redis缓存原理、详细解析了缓存模型、缓存一致性和缓存异常场景。

尽管（关系型）数据库系统 (SQL) 带来了许多出色的属性，例如 ACID，但为了保持这些属性，数据库的性能在“ 3 高” 条件环境下下往往显得捉襟见肘、苍白无力。

为了解决这个问题，我们往往需要在应用层（即处理业务逻辑的后端代码）和存储层（即 SQL 数据库）之间增加一个缓存层。该缓存层通常使用内存缓存来实现，毕竟，传统 SQL 数据库的性能瓶颈通常发生在二级存储（即硬盘）的 I/O 层面。随着主内存 (RAM) 的价格在过去十年中下降，故将（至少部分）数据存储在主内存中以提高性能便是一种性价比较高的解决方案。基于当前的技术发展现状，Redis 便成为当下一种较为流行的选择。

当然，大多数系统只将所谓的“热数据”存储在缓存层（即主内存）中。基于帕累托原理（也称为 80/20 法则），对于大多数事件，大约 80% 的影响来自 20% 的原因。为了节省成本，我们只需要将这 20% 存储在缓存层中。为了识别“热数据”，我们可以指定驱逐策略（例如 LFU 或 LRU ）来确定哪些数据将过期。

缓存概述

缓存是一种“预热”技术，用于将经常访问的数据存储在临时存储器（称为缓存）中，以减少硬盘驱动器的读/写。缓存无处不在，基于此技术可以大大地提高 Web 应用程序的性能。

通常，在最初的单体架构模型，当用户向我们的服务发送一个消息请求时，Web 服务器首先会读取或写入数据库再返回响应。在缓存的情况下，服务器首先检查缓存副本是否存在，如果存在则从缓存返回数据而不是询问数据库。它节省了时间和数据库的计算工作量。

下面简要介绍一下应用程序如何请求 Redis ，此处主要基于 Master-Slave-Sentinel 模式的集群，App 通过调用 Redis Client ，例如，Jedis、Lettuce 及 Redisson 等来与 Redis Sentinel 通信，当 Redis Master 切换至 Slave 时，Application 依旧能够正常工作，如下为详细的时序图：

缓存模型

在分布式系统中，基于 CAP 定理指导，根据业务需求和上下文选择这些策略，通常可将其划分为常规模式和 Cache-Aside 模式。在开始之前，让我们通过刷新缓存的方式来了解常用的缓存模式，具体如下所示：

写模型

1、Write Through：即“直写”。此模型为同步写入数据库后再缓存。这是安全的，因为它首先写入数据库，但比后写慢。与写无效相比，它为先写后读场景提供了更好的性能。在这种写入策略中，数据首先写入缓存，然后写入数据库。缓存与数据库串联，写入总是通过缓存到主数据库。

直写模式的算法是：

1）对于不可变操作（读取）：

此策略不处理不可变操作。它应该与通读模式相结合。

2）对于可变操作（创建、更新、删除）：

客户端只需要在 Redis 中创建、更新或删除条目。缓存层必须以原子方式将此更改同步到 MySQL。

直写模式的缺点也很明显。首先，许多缓存层本身并不支持这一点。其次，Redis 是缓存而不是 RDBMS。它的设计并非具有弹性。因此，更改在复制到 MySQL 之前可能会丢失。即使 Redis 现在已经支持 RDB 和 AOF 等持久化技术，但仍然不推荐这种方式。

就其本身而言，直写缓存似乎没有太大作用，实际上，它们会引入额外的写入延迟，因为数据先写入缓存，然后再写入主数据库。但是当与通读缓存配对时，我们可以获得通读的所有好处，并且我们还可以获得数据一致性保证，使我们免于使用缓存失效技术。

DynamoDB Accelerator (DAX) 是读取/写入缓存的一个很好的例子。它与 DynamoDB 和应用程序内联。可以通过 DAX 对 DynamoDB 进行读取和写入。

2、Write Behind：即“后写或回写”。基于此策略，应用程序将数据写入缓存，缓存会立即确认，并在延迟一段时间后将数据写回数据库。这对于写入速度非常快，如果将同一键上的多个写入合并为一次对数据库的写入，则速度会更快。但是数据库长时间与缓存不一致，如果在数据刷新到数据库之前进程崩溃，可能会丢失数据。RAID 卡是这种模式的一个很好的例子，为了避免数据丢失，通常需要 RAID 卡上的电池备份单元将数据保存在缓存中，但尚未登陆到磁盘。

Write Behind 模式的算法是：

1）对于不可变操作（读取）：

此策略不处理不可变操作。它应该与通读模式相结合。

2）对于可变操作（创建、更新、删除）：

客户端只需要在 Redis 中创建、更新或删除条目。缓存层将更改保存到消息队列中并向客户端返回成功。更改会异步复制到 MySQL，并且可能在 Redis 向客户端发送成功响应后发生。

后写模式与直写不同，因为它异步地将更改复制到 MySQL。它提高了吞吐量，因为客户端不必等待复制发生。具有高持久性的消息队列可能是一种可能的实现。Redis 流（自 Redis 5.0 起受支持）可能是一个不错的选择。为了进一步提高性能，可以结合更改并批量更新 MySQL（以节省查询次数）。

Write Behind 模式的缺点是相似的。首先，许多缓存层本身并不支持这一点。其次，使用的消息队列必须是 FIFO（先进先出）。否则，对 MySQL 的更新可能会乱序，因此最终结果可能不正确。

回写缓存提高了写入性能，适用于写入繁重的工作负载。与通读结合使用时，它适用于混合工作负载，其中最近更新和访问的数据始终在缓存中可用。

它对数据库故障具有弹性，并且可以容忍一些数据库停机时间。如果支持批处理或合并，它可以减少对数据库的总体写入，从而减少负载并降低成本，如果数据库提供程序按请求数量收费，例如动态数据库。请记住，DAX 是直写的，因此如果应用程序写入繁重，则不会看到任何成本降低。

一些开发人员将 Redis 用于缓存和回写，以更好地吸收峰值负载期间的峰值。主要缺点是如果缓存失败，数据可能会永久丢失。

大多数关系数据库存储引擎（即 InnoDB）在其内部默认启用回写缓存。查询首先写入内存并最终刷新到磁盘。

3、Write invalidate：类似于直写，先写入数据库，然后使缓存无效。在并发更新的情况下，这简化了缓存和数据库之间的一致性处理。我们不需要复杂的同步，权衡是命中率较低，因为我们总是使缓存无效并且下一次读取将始终未命中。

读模型

Read Through：即“ 通读 ”。当读取未命中时，需要从数据库中加载并保存到缓存中。这种模式的主要问题是基于某些特定的场景有时需要预热缓存。通读缓存与数据库保持一致。当缓存未命中时，它会从数据库中加载丢失的数据，填充缓存并将其返回给应用程序。

通读模式的算法是：

1、对于不可变操作（读取）：

客户端将始终简单地从缓存中读取。缓存命中或缓存未命中对客户端是透明的。如果是缓存未命中，缓存应该具有自动从数据库中获取的能力。

2、对于可变操作（创建、更新、删除）：

此策略不处理可变操作。它应该与直写（或后写）模式结合使用。

通读模式的一个主要缺点是许多缓存层可能不支持它。例如，Redis 将无法自动从 MySQL 获取（除非为 Redis 编写插件）。

Cache-Aside 和 Read-Through 策略都是延迟加载数据，即仅在第一次读取时加载。其适用用例场景如下所示：

虽然 Read- Through 和 Cache-Aside 非常相似，但至少有两个关键区别：

在缓存侧，应用程序负责从数据库中获取数据并填充缓存。在通读中，此逻辑通常由库或独立缓存提供程序支持。

与 Cache-Aside 不同，Read-Through Cache 中的数据模型不能与数据库的数据模型不同。

当多次请求相同的数据时，通读缓存最适合读取繁重的工作负载。例如，一个新闻故事。缺点是当第一次请求数据时，总是会导致缓存未命中，并招致将数据加载到缓存中的额外惩罚。开发人员通过手动发出查询来“加热”或“预热”缓存来处理这个问题。就像 cache-aside 一样，缓存和数据库之间的数据也有可能不一致，解决方法在于写入策略，我们将在下面看到。

不读或不写模型

Refresh ahead：预测热点数据并自动刷新数据库中的缓存，永不阻塞读取，最适合小型只读数据集，例如邮政编码列表缓存，我们可以定期刷新整个缓存，因为它很小并且是只读的。如果能够可以准确地预测最常读取哪些键，那么，还可以在此模式中预热这些键。最后，如果数据在系统之外更新而系统无法收到通知，可能必须使用此模式。

在大多数场景下，我们通常使用通读和直写/后写/写无效等模型。针对 Refresh-ahead 模型，其可以单独使用，也可以作为一种优化来预测和预热读取以进行通读。由谁负责缓存维护，调用者或专用层有两种实现模式。

1、Cache-Facade：缓存层是一个库或服务委托写入数据库，我们只与缓存层交谈。然后数据库对我们的应用程序是透明的。缓存层可以处理一致性和故障转移。例如，许多数据库都有自己的缓存，这是缓存外观的一个很好的例子。我们还可以编写一些进程内 DAO 层来读取/写入具有嵌入式缓存层的实体，从调用者的角度来看，这个小层也是一个缓存门面。

2、Cache-Aside：我们的应用程序保持缓存一致性，这意味着应用程序代码更复杂，但这提供了更大的灵活性。例如，像数据库查询缓存这样的缓存外观模式只能缓存行，如果想缓存带有行的 JAVA POJO 或 Kotlin 数据类，则将缓存放在一边要容易得多。但是它仍然可以使用缓存门面，例如，将 Spring 缓存作为门面库来缓存 POJO，并在后台自动处理数据库中的 POJO。

当缓存不支持原生的读通和写通操作，并且资源需求不可预测时，我们使用这种缓存侧模式。

1）读取：尝试命中缓存。如果没有命中，则从数据库中读取，然后更新缓存。

2）写入：先写入数据库，然后删除缓存条目。这里一个常见的陷阱是人们错误地用值更新了缓存，高并发环境下的双写会使缓存变脏。

在这种模式下，仍然有可能出现脏缓存。在满足这两种情况时会发生上述情况：读取数据库并更新缓存、更新数据库并删除缓存。

缓存一致性

缓存一致性模型（参考）图

如何保障缓存（Redis）与数据存储（数据库）之间的数据一致性，通常有多种设计实现策略，本文重点针对 Cache Aside Pattern（旁路缓存模式）进行简要解析，此模型也是在实际的业务场景中使用较为广泛的。具体如下。

在 Cache Aside Pattern 模型中，通常写请求场景基本流程主要为：先更新 DB，然后直接删除 Cache 。

在业务场景实现中，如果更新数据库成功，而进行缓存删除操作时出现失败的情况下，简单地说，通常主要有以下两个解决方案：

1、缩短 Cache 失效时间：我们让缓存数据的过期时间变短，这样的话缓存就会从数据库中加载数据。另外，这种解决办法对于先操作缓存后操作数据库的场景不适用。此方案在实际的业务场景中通常不推荐，本质上治标不治本。

2、增加 Cache 更新重试机制：如果 Cache 服务当前不可用导致缓存删除失败的话，我们就隔一段时间进行重试，重试次数可以自己定。如果多次重试还是失败的话，我们可以把当前更新失败的 Key 存入队列中，等缓存服务可用之后，再将缓存中对应的 Key 删除即可。可考虑使用消息队列。此方案算是一种常用的解决策略，能够满足绝大多数业务场景需要。

其实，从本质上而言，缓存方案的规划设计往往依赖于实际的业务场景需求，毕竟，技术是为业务服务的。可能有时我们引入缓存之后，为了解决短期内的不一致性问题，选择让系统设计变得更加复杂的话，完全没必要。

缓存异常场景

缓存场景模型图

其实。在实际的场景中，考虑到各种应用异常和业务故障，通常不可能完全使用分布式缓存和数据库系统来实现线性一致性模型。每一种缓存模式都有其自身的局限性，在某些情况下我们无法获得顺序一致性，或者有时会在缓存和数据库之间获得意外延迟。对于笔者在本文中展示的所有的解决方案，依据不同的业务需求总是会遇到高并发的极端情况。因此，对此没有灵丹妙药，在选择解决方案之前了解限制并定义特定的一致性要求。

如果想要实现线性一致性和容错性，建议最好不要使用缓存策略，可考虑其他的方案。以上为 Redis 缓存系统相关解析，希望对大家有用。

作者：李杰

来源：twt社区

Tags：Redis 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

Redis 不再 “开源”，未来采用 SSPLv1 和 RSALv2 许可证

Redis 官方于21日宣布修改开源协议 —— 未来所有版本都将使用 “源代码可用” 的许可证 (source-available licenses)。具体来说，Redis 将不再遵循 BSD 3-Clause...【详细内容】

2024-03-27　　Search: Redis 点击:(11)　　评论:(0)　　加入收藏

Redis“叛逃”开源，得罪了几乎所有人

内存数据库供应商Redis近日在开源界砸下了一块“巨石”。Redis即将转向双许可模式，并实施更为严格的许可条款。官方对此次变更的公告直截了当：从Redis 7.4版本开始，Redis将在Re...【详细内容】

2024-03-25　　Search: Redis 点击:(9)　　评论:(0)　　加入收藏

如何使用 Redis 实现消息队列

Redis不仅是一个强大的内存数据存储系统，它还可以用作一个高效的消息队列。消息队列是应用程序间或应用程序内部进行异步通信的一种方式，它允许数据生产者将消息放入队列中，然...【详细内容】

2024-03-22　　Search: Redis 点击:(17)　　评论:(0)　　加入收藏

Redis不再 “开源”

Redis 官方今日宣布修改开源协议 —— 未来所有版本都将使用 “源代码可用” 的许可证 (source-available licenses)。具体来说，Redis 将不再遵循 BSD 3-Clause 开...【详细内容】

2024-03-21　　Search: Redis 点击:(8)　　评论:(0)　　加入收藏

在Redis中如何实现分布式锁的防死锁机制？

在Redis中实现分布式锁是一个常见的需求，可以通过使用Redlock算法来防止死锁。Redlock算法是一种基于多个独立Redis实例的分布式锁实现方案，它通过协调多个Redis实例之间的锁...【详细内容】

2024-02-20　　Search: Redis 点击:(47)　　评论:(0)　　加入收藏

手动撸一个 Redis 分布式锁

大家好呀，我是楼仔。今天第一天开工，收拾心情，又要开始好好学习，好好工作了。对于使用 Java 的小伙伴，其实我们完全不用手动撸一个分布式锁，直接使用 Redisson 就行。但是因为这些...【详细内容】

2024-02-19　　Search: Redis 点击:(39)　　评论:(0)　　加入收藏

工作中Redis有哪些好用的运维工具

工作中使用 Redis 时，如果大家公司没有专业运维，可能开发人员就会面临这些运维的工作，包括 Redis 的运行状态监控，数据迁移，主从集群、切片集群的部署和运维等等。本文我就从这三...【详细内容】

2024-02-06　　Search: Redis 点击:(55)　　评论:(0)　　加入收藏

深入Go底层原理，重写Redis中间件实战

Go语言以其简洁、高效和并发性能而闻名，深入了解其底层原理可以帮助我们更好地利用其优势。在本文中，我们将探讨如何深入Go底层原理，以及如何利用这些知识重新实现一个简单的Re...【详细内容】

2024-01-25　　Search: Redis 点击:(66)　　评论:(0)　　加入收藏

批量执行Redis命令的四种方式！

前言在我们的印象中Redis命令好像都是一个个单条进行执行的，如果有人问你如何批量执行Redis命令，你能回答的上吗，或者说能答出几种方式呢？最容易想到的是Redis的一些批量命令，例...【详细内容】

2024-01-17　　Search: Redis 点击:(58)　　评论:(0)　　加入收藏

Redis 实现多规则限流的思考与实践

市面上很多介绍redis如何实现限流的，但是大部分都有一个缺点，就是只能实现单一的限流，比如1分钟访问1次或者60分钟访问10次这种，但是如果想一个接口两种规则都需要满足呢，我们的...【详细内容】

2024-01-03　　Search: Redis 点击:(109)　　评论:(0)　　加入收藏

▌简易百科推荐

Redis 不再 “开源”，未来采用 SSPLv1 和 RSALv2 许可证

2024-03-27　　dbaplus社群　　　　Tags:Redis 　点击:(11)　　评论:(0)　　加入收藏

Redis“叛逃”开源，得罪了几乎所有人

2024-03-25　　　　51CTO　　Tags:Redis 　点击:(9)　　评论:(0)　　加入收藏

如何使用 Redis 实现消息队列

2024-03-22　　后端Q　　微信公众号　　Tags:Redis 　点击:(17)　　评论:(0)　　加入收藏

Redis不再 “开源”

2024-03-21　　OSC开源社区　　　　Tags:Redis 　点击:(8)　　评论:(0)　　加入收藏

在Redis中如何实现分布式锁的防死锁机制？

2024-02-20　　编程技术汇　　　　Tags:Redis 　点击:(47)　　评论:(0)　　加入收藏

手动撸一个 Redis 分布式锁

2024-02-19　　楼仔　　微信公众号　　Tags:Redis 　点击:(39)　　评论:(0)　　加入收藏

工作中Redis有哪些好用的运维工具

2024-02-06　　waynaqua　　　　Tags:Redis 　点击:(55)　　评论:(0)　　加入收藏

批量执行Redis命令的四种方式！

2024-01-17　　小许code　　微信公众号　　Tags:Redis命令　点击:(58)　　评论:(0)　　加入收藏

Redis 实现多规则限流的思考与实践

2024-01-03　　架构精进之路　　微信公众号　　Tags:Redis 　点击:(109)　　评论:(0)　　加入收藏

一站式Redis解决方案

Redis是一个高效的内存数据库，它支持包括String、List、Set、SortedSet和Hash等数据类型的存储，在Redis中通常根据数据的key查询其value值，Redis没有模糊条件查询，在面对一些需...【详细内容】

2024-01-01　　大雷家吃饭　　　　Tags:Redis 　点击:(66)　　评论:(0)　　加入收藏

推荐资讯

AI是万灵药？Meta要把大	考研调剂第一次失败后
高职单招是什么意思？	在饭局上喝酒，要学会3
汽车不停能开多少公里	三证齐全，中国“飞的”
小米SU7被大卸八块，雷	视频号，从抖音挖来一个