文章目录[隐藏]
缓存
1. 基本概念
缓存(Cache),就是数据交换的缓冲区,俗称的缓存就是缓冲区内的数据,一般从数据库中获取,存储于本地代码
// 1. 本地用于高并发 static final ConcurrentHashMap
map = new ConcurrentHashMap<>(); // 2. 用于redis等缓存 static final Cache USER_CACHE = CacheBuilder.newBuilder().build(); // 3. 本地缓存 static final Map map = new HashMap(); 由于其被 static 修饰,所以随着类的加载而被加载到内存之中,作为本地缓存,由于其又被 final 修饰,所以其引用(
map
)和对象(new HashMap()
)之间的关系是固定的,不能改变,因此不用担心赋值(=)导致缓存失效
2. 为什么要使用缓存
一句话:因为速度快,好用
缓存数据存储于代码中,而代码运行在内存中,内存的读写性能远高于磁盘,缓存可以大大降低用户访问并发量带来的服务器读写压力
实际开发过程中,企业的数据量少则几十万,多则几千万。这么大数据量,如果没有缓存来作为"避震器",系统是几乎撑不住的,所以企业会大量运用到缓存技术。但是缓存也会增加代码复杂度和运营的成本:
优点
- 提高性能:缓存可以显著减少数据访问时间,从而加快系统的响应速度。对于频繁访问的数据,缓存可以避免重复的数据检索过程
- 减少带宽使用:缓存可以减少网络流量,因为它允许本地存储和访问数据,避免了重复的网络请求
- 负载均衡:缓存有助于分散服务器的负载,因为一部分请求可以由缓存来处理,从而减轻服务器的压力
- 提升用户体验:对于用户而言,缓存可以提供更快的加载时间和更流畅的交互体验
- 容错能力:在某些情况下,缓存可以作为数据的备份,当主要数据源出现问题时,缓存可以提供数据的临时访问
缺点
- 数据一致性问题:缓存中的数据可能会过时,这会导致数据不一致的问题。确保缓存与主数据源同步是一个挑战
- 资源消耗:维护缓存需要额外的存储资源和管理工作,这可能增加系统的复杂性和成本
- 缓存失效问题:设计不当的缓存机制可能导致频繁的缓存失效,从而降低系统性能
- 安全风险:如果不恰当地处理缓存数据,可能会引发安全问题,如敏感数据泄露
- 缓存穿透和雪崩问题:在极端情况下,大量请求绕过缓存直接请求数据库,可能会导致系统崩溃
3. 如何使用缓存
实际开发中,会构筑多级缓存来使系统运行速度进一步提升。例如:本地缓存与 redis 中的缓存并发使用
浏览器缓存:主要是存在于浏览器端的缓存
应用层缓存:可以分为 tomcat 本地缓存,比如之前提到的 map,或者是使用 redis 作为缓存
数据库缓存:在数据库中有一片空间是 buffer pool,增改查数据都会先加载到 mysql 的缓存中
CPU缓存:当代计算机最大的问题是 cpu 性能提升了,但内存读写速度没有跟上,所以为了适应当下的情况,增加了 cpu 的 L1、L2、L3 级的缓存
4. 缓存更新策略
缓存更新是 redis 为了节约内存而设计出来的一个东西,主要是因为内存数据宝贵。当我们向 redis 插入太多数据,此时就可能会导致缓存中的数据过多,所以 redis 会对部分数据进行更新,或者把它叫为淘汰更合适
内存淘汰:redis 自动进行,当 redis 内存达到咱们设定的 max-memery
的时候,会自动触发淘汰机制,淘汰掉一些不重要的数据(可以自己设置策略方式)
超时剔除:当我们给 redis 设置了过期时间 TTL 之后,redis 会将超时的数据进行删除,方便咱们继续使用缓存
主动更新:我们可以手动调用方法把缓存删掉,通常用于解决缓存和数据库不一致问题
内存淘汰 | 超时剔除 | 主动更新 | |
---|---|---|---|
说明 | 不用自己维护,利用 Redis 的内存淘汰机制,当内存不足时自动淘汰部分数据。下次查询时更新缓存 | 给缓存数据添加 TTL 时间,到期后自动删除缓存。下次查询时更新缓存 | 编写业务逻辑,在修改数据库的同时,更新缓存 |
一致性 | 差 | 一般 | 好 |
维护成本 | 无 | 低 | 高 |
业务场景:
- 低一致性需求:使用内存淘汰机制。例如店铺类型的查询缓存
- 高一致性需求:主动更新,并以超时剔除作为兜底方案。例如店铺详情查询的缓存
4.1 缓存不一致解决方案
由于我们的缓存的数据源来自数据库,而数据库的数据是会发生变化的。因此,如果当数据库中数据发生变化,而缓存却没有同步,此时就会有一致性问题存在,其后果是:
用户使用缓存中的过时数据,就会产生类似多线程数据安全问题,从而影响业务、产品口碑等,怎么解决呢?有如下几种方案
- Cache Aside Pattern 人工编码方式:缓存调用者在更新完数据库后再去更新缓存,也称之为双写方案
- Read/Write Through Pattern: 由系统本身完成,数据库与缓存的问题交由系统本身去处理
- Write Behind Caching Pattern:调用者只操作缓存,其他线程去异步处理数据库,实现最终一致
4.2 缓存不一致采用方案
综合考虑使用方案一,但是方案一调用者如何处理呢?
操作缓存和数据库时有三个问题需要考虑:
-
删除缓存还是更新缓存?
- 更新缓存:每次更新数据库都更新缓存,无效写操作较多
- 删除缓存:更新数据库时让缓存失效,查询时再更新缓存
如果采用第一个方案,那么假设我们每次操作数据库后,都操作缓存,但是中间如果没有人查询,那么这个更新动作实际上只有最后一次生效,中间的更新动作意义并不大。我们可以把缓存删除,等待再次查询时,将缓存中的数据加载出来
-
如何保证缓存与数据库的操作的同时成功或失败?
- 单体系统,将缓存与数据库操作放在一个事务
- 分布式系统,利用 TCC 等分布式事务方案
-
先操作缓存还是先操作数据库?
- 先删除缓存,再操作数据库
- 先操作数据库,再删除缓存
先操作数据库,再删除缓存,原因在于:
如果是先删除缓存,再操作数据库,在两个线程并发来访问时,假设线程1先来,它先把缓存删了,此时线程2过来,它查询缓存数据并不存在,此时它写入缓存,当它写入缓存后,线程1再执行更新动作时,实际上写入的就是旧的数据,新的数据被旧数据覆盖了
5. 缓存穿透
客户端请求的数据在缓存中和数据库中都不存在,这样缓存永远不会生效,这些请求都会打到数据库
常见的解决方案有两种:
-
缓存空对象
- 优点:实现简单,维护方便
- 缺点:
- 额外的内存消耗
- 可能造成短期的不一致
当我们客户端访问不存在的数据时,先请求 redis,但是此时 redis 中没有数据,此时会访问到数据库,但是数据库中也没有数据,这个数据穿透了缓存,直击数据库。我们都知道数据库能够承载的并发不如 redis 这么高,如果大量的请求同时过来访问这种不存在的数据,这些请求就都会访问到数据库。简单的解决方案就是哪怕这个数据在数据库中也不存在,我们也把这个数据存入到 redis 中去,这样,下次用户过来访问这个不存在的数据,那么在 redis 中也能找到这个数据就不会进入到缓存了
-
布隆过滤
- 优点:内存占用较少,没有多余 key
- 缺点:
- 实现复杂
- 存在误判可能
布隆过滤器其实采用的是哈希思想来解决这个问题,通过一个庞大的二进制数组,用哈希思想去判断当前这个要查询的这个数据是否存在。如果布隆过滤器判断存在,则放行,这个请求会去访问 redis,哪怕此时 redis 中的数据过期了,但是数据库中可能存在这个数据,在数据库中查询出来这个数据后,再将其放入到redis中。假设布隆过滤器判断这个数据不存在,则直接返回
这种方式优点在于节约内存空间,存在误判,误判原因在于:布隆过滤器走的是哈希思想,只要哈希思想,就可能存在哈希冲突
6. 缓存雪崩
缓存中大量的数据在同一时间失效过期或者 Redis 服务宕机,导致大量请求直接打到数据库,可能引起数据库瘫痪
解决方案:
- 设置不同的过期时间:避免大量缓存同时过期,可以通过设置不同的过期时间来分散压力
- 使用持久化存储:确保缓存服务的持久化,比如使用 Redis 的持久化功能,即使服务重启也能从硬盘恢复数据
- 利用 Redis 集群:即使单个节点宕机,集群的其它节点仍可继续提供服务,从而确保缓存系统的稳定性
7. 缓存击穿
某个热点 key 在缓存过期的瞬间,有大量并发请求查询这个 key,导致所有的请求都打到数据库,可能引起数据库压力过大
假设线程1在查询缓存之后,本来应该去查询数据库,然后把这个数据重新加载到缓存的,此时只要线程1走完这个逻辑,其他线程就都能从缓存中加载这些数据了,但是假设在线程1没有走完的时候,后续的线程2,线程3,线程4同时过来访问当前这个方法, 那么这些线程都不能从缓存中查询到数据,那么他们就会同一时刻来访问查询缓存,都没查到,接着同一时间去访问数据库,同时的去执行数据库代码,对数据库访问压力过大
常见的解决方案有两种:
-
互斥锁
- 优点:
- 没有额外的内存消耗
- 保证一致性
- 实现简单
- 缺点:
- 线程需要等待,性能受影响
- 可能有死锁风险
因为锁能实现互斥性。假设线程过来,只能一个人一个人的来访问数据库,从而避免对于数据库访问压力过大,但这也会影响查询的性能,因为此时会让查询的性能从并行变成了串行,我们可以采用
try Lock
方法 +double check
来解决这样的问题假设现在线程1过来访问,它查询缓存没有命中,但是此时它获得到了锁的资源,那么线程1就会一个人去执行逻辑。假设现在线程2过来,线程2在执行过程中,并没有获得到锁,那么线程2就可以进行到休眠,直到线程1把锁释放后,线程2获得到锁,然后再来执行逻辑,此时就能够从缓存中拿到数据了
-
逻辑过期
- 优点:
- 线程无需等待,性能较好
- 缺点:
- 不保证一致性
- 有额外内存消耗
- 实现复杂
我们之所以会出现这个缓存击穿问题,主要原因是在于我们对 key 设置了过期时间,假设我们不设置过期时间,其实就不会有缓存击穿的问题,但是不设置过期时间,这样数据不就一直占用我们内存了吗,我们可以采用逻辑过期方案
我们把过期时间设置在 redis 的 value 中,注意:这个过期时间并不会直接作用于 redis,而是我们后续通过逻辑去处理
假设线程1去查询缓存,然后从 value 中判断出来当前的数据已经过期了,此时线程1去获得互斥锁,那么其他线程会进行阻塞,获得了锁的线程他会开启一个线程去进行以前的重构数据的逻辑,直到新开的线程完成这个逻辑后,才释放锁,而线程1直接进行返回。假设现在线程3过来访问,由于线程线程2持有着锁,所以线程3无法获得锁,线程3也直接返回数据,只有等到新开的线程2把重建数据构建完后,其他线程才能走返回正确的数据
这种方案巧妙在于,异步的构建缓存,缺点在于在构建完缓存之前,返回的都是脏数据
7.1 互斥锁
相较于原来从缓存中查询不到数据后直接查询数据库而言,现在的方案是进行查询之后,如果从缓存没有查询到数据,则进行互斥锁的获取,获取互斥锁后,判断是否获得到了锁:
- 如果没有获得到,则休眠,过一会再进行尝试,直到获取到锁为止,才能进行查询
- 如果获取到了锁,则该线程再去进行查询,查询后将数据写入 redis,再释放锁,返回数据
利用互斥锁就能保证只有一个线程去执行操作数据库的逻辑,防止缓存击穿
核心逻辑:
利用 redis 的 setnx 方法来表示获取锁,该方法含义是:
- redis 中如果没有这个 key,则插入成功,返回 1,在
stringRedisTemplate
中返回 true - redis 中如果有这个 key 则插入失败,则返回 0,在
stringRedisTemplate
中返回 false
我们可以通过 true 或者 false,来表示是否有线程成功插入 key,成功插入 key 的线程我们认为它就是获得到锁的线程
private boolean tryLock(String key) {
Boolean flag = stringRedisTemplate.opsForValue().setIfAbsent(key, "1", 10, TimeUnit.SECONDS);
return BooleanUtil.isTrue(flag);
}
private void unLock(String key) {
stringRedisTemplate.delete(key);
}
操作代码:
public Shop queryWithMutex(Long id) {
String key = CACHE_SHOP_KEY + id;
// 1. 从 redis 中查询商铺缓存
String shopJson = stringRedisTemplate.opsForValue().get(key);
// 2. 判断缓存是否命中
if (StrUtil.isNotBlank(shopJson)) {
// 2.1 命中则返回店铺信息
return JSONUtil.toBean(shopJson, Shop.class);
}
// 3. 判断是否为空值
if ("".equals(shopJson)) {
return null;
}
// 4. 实现缓存击穿
String lockKey = "lock:shop:" + id;
Shop shop = null;
try {
// 4.1 获取互斥锁
boolean isLock = tryLock(lockKey);
// 4.2 判断是否获取成功
if (!isLock) {
// 4.3 失败,则休眠并重试
Thread.sleep(50);
return queryWithMutex(id);
}
// 4.4 成功,根据 id 查询数据库
shop = super.getById(id);
// 5. 判断商铺是否存在
if (shop == null) {
// 5.1 不存在将空值写入到 redis
stringRedisTemplate.opsForValue().set(key, "", CACHE_NULL_TTL, TimeUnit.MINUTES);
// 5.2 返回错误信息
return null;
}
// 6. 存在,将商铺数据写入 redis
stringRedisTemplate.opsForValue().set(key, JSONUtil.toJsonStr(shop), CACHE_SHOP_TTL, TimeUnit.MINUTES);
} catch (InterruptedException e) {
throw new RuntimeException(e);
} finally {
// 7. 释放互斥锁
unLock(lockKey);
}
// 8. 返回
return shop;
}
7.2 逻辑过期
当用户开始查询 redis 时,判断是否命中,如果没有命中则直接返回空数据,不查询数据库,而一旦命中后,将 value 取出,判断 value 中的过期时间是否满足,如果没有过期,则直接返回 redis 中的数据,如果过期,则在开启独立线程后直接返回之前的数据,独立线程去重构数据,重构完成后释放互斥锁
操作代码:
新建一个实体类,这种方法对原来代码没有侵入性
@Data
public class RedisData {
private LocalDateTime expireTime;
private Object data;
}
重建缓存
public void saveShop2Redis(Long id, Long expireSeconds) throws InterruptedException {
// 1. 查询店铺数据
Shop shop = getById(id);
// 2. 封装逻辑过期时间
RedisData redisData = new RedisData();
redisData.setData(shop);
redisData.setExpireTime(LocalDateTime.now().plusSeconds(expireSeconds));
// 3. 写入Redis
stringRedisTemplate.opsForValue().set(CACHE_SHOP_KEY + id, JSONUtil.toJsonStr(redisData));
}
核心逻辑
private static final ExecutorService CACHE_REBUILD_EXECUTOR = Executors.newFixedThreadPool(10);
public Shop queryWithLogicalExpire(Long id) {
String key = CACHE_SHOP_KEY + id;
// 1. 从 redis 中查询商铺缓存
String shopJson = stringRedisTemplate.opsForValue().get(key);
// 2. 判断缓存是否命中
if (StrUtil.isBlank(shopJson)) {
// 2.1 未命中返回空
return null;
}
// 3. 命中,需要先把 json 反序列化对象
RedisData redisData = JSONUtil.toBean(shopJson, RedisData.class);
Shop shop = JSONUtil.toBean((JSONObject) redisData.getData(), Shop.class);
LocalDateTime expireTime = redisData.getExpireTime();
// 4. 判断缓存是否过期
if (expireTime.isAfter(LocalDateTime.now())) {
// 4.1 未过期,返回商铺信息
return shop;
}
// 5.已过期,需要缓存重建
String lockKey = LOCK_SHOP_KEY + id;
// 5.1 尝试获取互斥锁
boolean isLock = tryLock(lockKey);
// 5.2 判断是否获取锁成功
if (isLock) {
// 5.3 成功,开启独立线程,进行缓存重建
CACHE_REBUILD_EXECUTOR.submit(() -> {
try {
// 重建缓存
saveShop2Redis(id, 20L);
// 释放锁
} catch (Exception e) {
throw new RuntimeException(e);
} finally {
unLock(lockKey);
}
});
}
// 6. 返回过期的商品信息
return shop;
}
8. 封装 Redis 工具类
基于 StringRedisTemplate
封装一个缓存工具类,满足下列需求:
-
方法1:将任意 Java 对象序列化为 json 并存储在 string 类型的 key 中,并且可以设置 TTL 过期时间
-
方法2:将任意 Java 对象序列化为 json 并存储在 string 类型的 key 中,并且可以设置逻辑过期时间,用于处理缓存击穿问题
-
方法3:根据指定的 key 查询缓存,并反序列化为指定类型,利用缓存空值的方式解决缓存穿透问题
-
方法4:根据指定的 key 查询缓存,并反序列化为指定类型,需要利用逻辑过期解决缓存击穿问题
@Component
public class RedisUtil {
@Resource
private final StringRedisTemplate stringRedisTemplate;
private static final ExecutorService CACHE_REBUILD_EXECUTOR = Executors.newFixedThreadPool(10);
public void set(String key, Object value, Long time, TimeUnit unit) {
stringRedisTemplate.opsForValue().set(key, JSONUtil.toJsonStr(value), time, unit);
}
public void setWithLogicalExpire(String key, Object value, Long time, TimeUnit unit) {
// 设置逻辑过期时间
RedisData redisData = new RedisData();
redisData.setData(value);
redisData.setExpireTime(LocalDateTime.now().plusSeconds(unit.toSeconds(time)));
// 写入redis
stringRedisTemplate.opsForValue().set(key, JSONUtil.toJsonStr(redisData));
}
public <R, ID> R queryWithPassThrough(
String keyPrefix, ID id, Class<R> type, Function<ID, R> dbFallback, Long time, TimeUnit unit) {
String key = keyPrefix + id;
// 1. 从redis查询缓存
String json = stringRedisTemplate.opsForValue().get(key);
// 2. 判断缓存是否命中
if (StrUtil.isNotBlank(json)) {
// 2.1 命中则返回店铺信息
return JSONUtil.toBean(json, type);
}
// 3. 判断是否为空值
if ("".equals(json)) {
return null;
}
// 4. 未命中,根据id查询数据库
R r = dbFallback.apply(id);
// 5. 判断是否存在
if (r == null) {
// 5.1 不存在,将空值写入到redis
stringRedisTemplate.opsForValue().set(key, "", CACHE_NULL_TTL, TimeUnit.MINUTES);
// 5.2 返回错误信息
return null;
}
// 6.存在,将数据写入redis
this.set(key, r, time, unit);
// 7.返回
return r;
}
public <R, ID> R queryWithLogicalExpire(
String keyPrefix, ID id, Class<R> type, Function<ID, R> dbFallback, Long time, TimeUnit unit) {
String key = keyPrefix + id;
// 1. 从redis查询缓存
String json = stringRedisTemplate.opsForValue().get(key);
// 2. 判断缓存是否命中
if (StrUtil.isBlank(json)) {
// 2.1 未命中返回空
return null;
}
// 3. 命中,需要先把 json 反序列化对象
RedisData redisData = JSONUtil.toBean(json, RedisData.class);
R r = JSONUtil.toBean((JSONObject) redisData.getData(), type);
LocalDateTime expireTime = redisData.getExpireTime();
// 4.判断缓存是否过期
if (expireTime.isAfter(LocalDateTime.now())) {
// 4.1 未过期,返回商铺信息
return r;
}
// 5. 已过期,需要缓存重建
String lockKey = LOCK_SHOP_KEY + id;
// 5.1 尝试获取互斥锁
boolean isLock = tryLock(lockKey);
// 5.2 判断是否获取锁成功
if (isLock) {
// 5.3 成功,开启独立线程,进行缓存重建
CACHE_REBUILD_EXECUTOR.submit(() -> {
try {
// 查询数据库
R r1 = dbFallback.apply(id);
// 写入redis
this.set(key, (String) r1, time, unit);
} catch (Exception e) {
throw new RuntimeException(e);
} finally {
// 释放锁
unLock(lockKey);
}
});
}
// 6. 返回过期的商品信息
return r;
}
private boolean tryLock(String key) {
Boolean flag = stringRedisTemplate.opsForValue().setIfAbsent(key, "1", 10, TimeUnit.SECONDS);
return BooleanUtil.isTrue(flag);
}
private void unLock(String key) {
stringRedisTemplate.delete(key);
}
}