spring-data-redis 连接泄漏，我 TM 人傻了-linux运维-PHP中文网

在升级到spring 5.3.x后，我发现gc次数急剧增加，这让我感到非常困惑。另外，我在使用索引字段查询的大表sql时，竟然变成了全表扫描，这真是令人头疼。更糟糕的是，在获取异常信息时，如果再出现异常，我根本找不到相关的日志，这让我彻底懵了。

spring-data-redis 连接泄漏，我 TM 人傻了

最近我们上线了一个新的微服务系统，结果上线后就开始报告各种请求超时问题，这是怎么回事呢？

spring-data-redis 连接泄漏，我 TM 人傻了

为了定位问题，我通常会使用JFR（可以参考我的其他系列文章，经常用到JFR）来分析。针对历史某些请求响应慢的问题，我的分析流程如下：

首先，我会检查是否存在STW（Stop-the-world，参考我的另一篇文章：JVM相关 - SafePoint 与 Stop The World 全解），看看是否有GC导致的长时间STW，或者是否有其他原因导致进程所有线程进入safepoint，从而导致STW。接着，我会检查是否IO操作花费了太长时间，比如调用其他微服务或访问各种存储（硬盘、数据库、缓存等）。然后，我会查看是否某些锁导致了长时间的阻塞，以及是否CPU占用过高，哪些线程导致的。

通过JFR，我发现很多HTTP线程在一个锁上阻塞了，这个锁是从Redis连接池获取连接的锁。我们的项目使用的是spring-data-redis，底层客户端使用lettuce。为什么会在这里阻塞呢？经过分析，我发现spring-data-redis存在连接泄漏的问题。

spring-data-redis 连接泄漏，我 TM 人傻了

让我们简单介绍一下Lettuce。Lettuce是一个使用Project Reactor和Netty实现的Redis非阻塞响应式客户端。spring-data-redis是对Redis操作的统一封装。我们的项目使用的是spring-data-redis和Lettuce的组合。

为了清楚地解释问题的原因，这里先简要介绍一下spring-data-redis和lettuce的API结构。

首先，lettuce官方不推荐使用连接池，但在某些情况下，官方没有明确说明是否需要使用连接池。结论如下：

如果你的项目中使用的是spring-data-redis和lettuce，并且只使用Redis简单命令，没有使用Redis事务、Pipeline等，那么不使用连接池是最好的选择（并且你没有关闭Lettuce连接共享，这个默认是开启的）。如果你在项目中大量使用了Redis事务，那么最好还是使用连接池。更准确地说，如果你使用了大量会触发execute(SessionCallback)的命令，最好使用连接池；如果你使用的都是execute(RedisCallback)的命令，就不太有必要使用连接池了。如果大量使用Pipeline，最好还是使用连接池。

接下来介绍spring-data-redis的API原理。我们的项目主要使用spring-data-redis的两个核心API，即同步的RedisTemplate和异步的ReactiveRedisTemplate。这里我们主要以同步的RedisTemplate为例来说明原理。ReactiveRedisTemplate其实就是做了异步封装，Lettuce本身就是异步客户端，所以ReactiveRedisTemplate的实现更简单。

RedisTemplate的所有Redis操作，最终都会被封装成两种操作对象，一是RedisCallback：

public interface RedisCallback {
    @Nullable
    T doInRedis(RedisConnection connection) throws DataAccessException;
}

这是一个函数式接口，入参是RedisConnection，可以通过它操作Redis。可以是一组Redis操作的集合。大部分RedisTemplate的简单Redis操作都是通过这个实现的。例如Get请求的源码实现就是：

//在 RedisCallback 的基础上增加统一反序列化的操作
abstract class ValueDeserializingRedisCallback implements RedisCallback {
    private Object key;
public ValueDeserializingRedisCallback(Object key) {
    this.key = key;
}

public final V doInRedis(RedisConnection connection) {
    byte[] result = inRedis(rawKey(key), connection);
    return deserializeValue(result);
}

@Nullable
protected abstract byte[] inRedis(byte[] rawKey, RedisConnection connection);
}
//Redis Get 命令的实现
public V get(Object key) {
return execute(new ValueDeserializingRedisCallback(key) {
@Override
protected byte[] inRedis(byte[] rawKey, RedisConnection connection) {
//使用 connection 执行 get 命令
return connection.get(rawKey);
}
}, true);
}
另一种是SessionCallback：
public interface SessionCallback {
@Nullable
T execute(RedisOperations operations) throws DataAccessException;
}
SessionCallback也是一个函数式接口，方法体也是可以放若干个命令。顾名思义，即在这个方法中的所有命令，都是会共享同一个会话，即使用的Redis连接是同一个并且不能被共享的。一般如果使用Redis事务则会使用这个实现。
RedisTemplate的API主要是以下这几个，所有的命令底层实现都是这几个API：


execute(RedisCallback action) 和 executePipelined(final SessionCallback session)：执行一系列Redis命令，是所有方法的基础，里面使用的连接资源会在执行后自动释放。

executePipelined(RedisCallback action) 和 executePipelined(final SessionCallback session)：使用PipeLine执行一系列命令，连接资源会在执行后自动释放。

executeWithStickyConnection(RedisCallback callback)：执行一系列Redis命令，连接资源不会自动释放，各种Scan命令就是通过这个方法实现的，因为Scan命令会返回一个Cursor，这个Cursor需要保持连接（会话），同时交给用户决定什么时候关闭。


通过源码我们可以发现，RedisTemplate的三个API在实际应用的时候，经常会发生互相嵌套递归的情况。
例如如下这种：
redisTemplate.executePipelined(new RedisCallback