mybatis 分页插件的实现原理是什么？

煙雲

发布时间：2025-11-17 06:17:26

724人浏览过

来源于php中文网

原创

MyBatis分页插件通过拦截StatementHandler的prepare方法，在SQL执行前动态改写SQL实现分页。首先拦截SQL获取原始语句，根据数据库类型判断生成对应分页语法（如MySQL用LIMIT，Oracle用ROWNUM嵌套查询），并构造COUNT(*)查询获取总记录数，最终将分页数据与总数封装返回。该过程需处理SQL解析、参数映射、多数据库兼容等问题，核心在于利用MyBatis拦截器机制实现SQL透明改写。

mybatis 分页插件的实现原理是什么？

MyBatis 分页插件的实现原理，简单来说，它利用了 MyBatis 提供的拦截器（Interceptor）机制，在 SQL 执行到数据库之前，动态地修改或增强 SQL 语句，加入分页相关的逻辑，比如 LIMIT 或 ROWNUM。这样，开发者在编写业务逻辑时就无需手动处理分页 SQL，极大地提升了开发效率。

解决方案

MyBatis 分页插件的核心在于对 StatementHandler 的拦截。当 MyBatis 准备执行一条 SQL 语句时，它会经过一系列内部组件的处理，其中 StatementHandler 负责准备语句（PreparedStatement）和设置参数。分页插件通常会在这里动手脚。

具体的工作流程大概是这样的：

注册拦截器：首先，分页插件作为一个自定义的 MyBatis 拦截器被注册到配置中。
拦截点选择：它会选择拦截 StatementHandler 接口的 prepare 方法（或者 query 方法，但 prepare 更常见，因为它在 SQL 准备阶段）。这个方法是 SQL 语句被发送到数据库驱动之前最后一道关卡。
获取原始 SQL：在拦截器内部，插件可以获取到当前将要执行的原始 SQL 语句。
SQL 改写：
- 总数查询：为了实现完整的页码显示（比如“共100条，当前第1页/共10页”），插件通常会根据原始 SQL 构造一个用于查询总记录数的 SQL 语句（例如，将 SELECT ... FROM ... 改写为 SELECT COUNT(*) FROM (...) AS total_count_table）。这个总数查询会先执行一次。
- 分页数据查询：接着，插件会根据当前请求的页码和每页大小，对原始 SQL 进行二次改写，加入数据库特定的分页语法。
  - 对于 MySQL 或 PostgreSQL，这通常是添加 LIMIT offset, pageSize。
  - 对于 Oracle，则会使用复杂的嵌套查询，结合 ROWNUM 来实现分页。
- 这个改写后的 SQL 语句才是真正用于获取当前页数据的。
参数处理：如果 SQL 改写引入了新的参数（比如 Oracle 的 ROWNUM 边界值），插件也需要相应地处理这些参数的设置。
放行执行：改写完成后，插件会将修改后的 SQL 语句放行，交由 MyBatis 框架继续执行，最终由 JDBC 驱动发送给数据库。
结果封装：在结果返回后，插件还会将总记录数和当前页数据封装成一个分页对象（例如 PageInfo），方便业务层使用。

这个过程听起来有点像“狸猫换太子”，但它确实巧妙地利用了 MyBatis 提供的扩展点，让分页逻辑对业务代码完全透明。

MyBatis分页插件是如何拦截SQL并进行改写的？

在我看来，MyBatis 分页插件拦截 SQL 的过程，是其最精髓的部分。它主要依赖于 Interceptor 接口中的 plugin 方法和 intercept 方法。当你配置好一个分页插件后，MyBatis 会在初始化时，为你的 Executor、StatementHandler、ParameterHandler、ResultSetHandler 这些核心组件生成代理对象。

具体到 StatementHandler 的拦截，当应用程序调用 SqlSession 的 selectList 或 selectOne 方法时，MyBatis 内部会层层调用，最终到达 StatementHandler。在 StatementHandler 的 prepare 方法被执行之前（也就是 JDBC PreparedStatement 被创建之前），分页插件的 intercept 方法就会被触发。

在 intercept 方法里：

获取目标对象：插件会通过 invocation.getTarget() 获取到当前的 StatementHandler 实例。
反射获取连接和 SQL：通过反射机制，插件可以从 StatementHandler 中拿到当前的数据库连接（用于后续可能进行的总数查询）以及即将执行的 BoundSql 对象（其中包含了原始 SQL 语句和参数）。
判断数据库类型：这是改写 SQL 的关键一步。插件会根据数据库连接的元数据（DatabaseMetaData）或者配置来判断当前连接的是哪种数据库（MySQL、Oracle、PostgreSQL 等），因为不同数据库的分页语法差异很大。
构造总数 SQL：插件会根据原始 SQL，智能地构建一个 COUNT(*) 查询。这个过程需要处理一些边缘情况，比如 SQL 中包含 GROUP BY、DISTINCT 或者复杂的子查询。例如，一个简单的 SELECT * FROM users WHERE age > 18 可能会被改写成 SELECT COUNT(*) FROM (SELECT * FROM users WHERE age > 18) temp_count。
执行总数查询：通过获取到的数据库连接，插件会执行这个 COUNT(*) SQL，获取总记录数。这个查询通常是独立的，不影响原始的查询上下文。
构造分页 SQL：根据原始 SQL、当前页码和每页大小，以及数据库类型，插件会生成最终的分页 SQL。
- MySQL/PostgreSQL 示例：SELECT * FROM original_table LIMIT offset, pageSize
- Oracle 示例：SELECT * FROM (SELECT t.*, ROWNUM rn FROM (原始SQL) t WHERE ROWNUM = startRow 这个改写过程需要相当的鲁棒性，以应对各种复杂的 SQL 结构。
替换 SQL：最后，插件会通过反射，将 BoundSql 对象中的原始 SQL 替换为新生成的分页 SQL。这样，当 StatementHandler 继续执行时，它操作的就是已经改写好的分页 SQL 了。

整个过程，就像是插件在SQL到达数据库前，给它“整容”了一下，让它变得符合分页的需求。

为什么MyBatis分页插件需要处理两次SQL查询？

关于两次 SQL 查询，这确实是分页插件的一个常见实现模式，而且是出于实用性考虑。我个人认为，主要原因在于“分页”这个概念本身就包含了两个核心信息：当前页的数据和总记录数。

获取总记录数的需求：

腾讯云AI代码助手
基于混元代码大模型的AI辅助编码工具

下载
- 在前端页面上，我们通常需要显示“总共 X 条记录，共 Y 页”这样的信息，或者提供完整的页码导航（1, 2, 3... 末页）。这些都需要知道总共有多少条记录符合查询条件。
- 如果只执行一次带有 LIMIT 或 ROWNUM 的分页 SQL，你只能得到当前页的数据，无法直接知道总共有多少条记录，也就无法计算总页数。
- 因此，分页插件为了提供完整的、用户友好的分页体验，就不得不额外执行一次 COUNT(*) 查询来获取总记录数。
数据查询的独立性：
- 获取总数和获取当前页数据，是两个逻辑上独立但又相关联的任务。
- 获取总数只需要 COUNT(*)，不需要实际的数据内容，所以可以只返回一个数字。
- 获取当前页数据则需要实际的字段内容，并且需要限定返回的行数。
- 将这两个任务分开执行，可以避免在一个 SQL 语句中既要计算总数又要获取指定行数数据的复杂性（虽然理论上有些数据库的某些特性可能支持，但通用性不佳）。

潜在的挑战与权衡：

性能开销：最直接的影响就是性能。两次数据库查询，意味着更多的网络传输、更多的数据库资源消耗。在高并发场景下，这可能是个不小的负担。这也是为什么一些分页插件会提供选项，允许开发者选择是否执行总数查询（如果业务场景不需要显示总数或总页数，可以关闭）。
事务问题：两次查询通常在同一个事务中进行，以保证数据的一致性。如果第一次查询总数后，数据发生了变化，第二次查询数据时可能就会出现不一致。但在大多数Web应用中，由于查询速度快，这种不一致的窗口期非常小，通常可以接受。
复杂 SQL 的挑战：对于包含 GROUP BY、HAVING、UNION 或复杂子查询的 SQL 语句，改写 COUNT(*) SQL 可能会变得非常复杂，甚至容易出错。插件需要非常智能地解析 SQL 结构，才能正确地生成总数查询语句。

尽管存在这些挑战，但为了提供完整的、便捷的分页功能，两次 SQL 查询的模式仍然是目前最普遍和实用的选择。毕竟，开发效率和用户体验在很多时候是比微小的性能损耗更重要的考量。

MyBatis分页插件在实现时可能遇到哪些挑战或优化点？

实现一个健壮且高效的MyBatis分页插件，远不是看起来那么简单，它会遇到不少技术挑战和值得深思的优化点。在我看来，这些挑战主要围绕着SQL的通用性、性能和兼容性展开。

SQL解析与改写的复杂性：
- 方言多样性：这是最直接的挑战。MySQL的LIMIT、Oracle的ROWNUM、SQL Server的TOP和ROW_NUMBER()，每种数据库的实现方式都大相径庭。插件必须针对每种主流数据库实现一套独立的SQL改写逻辑。
- 复杂SQL结构：这是真正的难点。简单的SELECT * FROM table改写起来很容易，但如果SQL中包含：
  - 子查询（Subquery）：尤其是嵌套多层的子查询，如何正确地在其外部或内部添加分页逻辑，同时不破坏原有语义？
  - 联表查询（JOIN）：通常影响不大，但如果联表后有GROUP BY或DISTINCT，总数查询的改写就变得复杂。
  - GROUP BY和HAVING：对这类SQL进行COUNT(*)改写时，需要确保COUNT(*)是针对GROUP BY后的结果集计数，而不是原始行数。
  - ORDER BY：在某些数据库（如Oracle的ROWNUM分页）中，ORDER BY必须在内部子查询中先执行，才能保证分页的顺序正确。有时，插件可能还需要判断是否需要移除或调整ORDER BY子句。
  - UNION或UNION ALL：处理包含UNION的SQL时，通常需要将每个UNION前的子查询都进行分页处理，或者将整个UNION结果作为一个子查询再进行分页。
- SQL解析器：一个好的分页插件通常需要一个强大的SQL解析器（比如Druid的SQL Parser），来准确地识别SQL的结构，才能进行可靠的改写。自己手写正则匹配是远远不够的，因为SQL语法实在太复杂了。
性能优化与考量：
- 两次查询的开销：前面提到了，这是最显著的性能瓶颈。
  - 优化总数查询：对于非常大的表，COUNT(*)本身就可能很慢。一些优化策略包括：
    - 缓存总数：如果查询条件不变，可以在一定时间内缓存总数，避免重复查询。
    - 异步获取总数：在某些场景下，如果总数不是立即需要，可以异步发起总数查询，不阻塞主线程获取分页数据。
    - 条件性总数查询：允许用户配置在某些情况下不执行总数查询（例如，当不需要显示总页数时）。
- 大偏移量分页问题：当offset（偏移量）非常大时，即使LIMIT的pageSize很小，数据库也可能需要扫描大量行才能跳到指定位置，这会非常慢。
  - 优化策略：对于大偏移量，可以考虑使用基于游标（cursor-based）或上次查询的id作为起始点（WHERE id > last_id LIMIT pageSize）的分页方式，而不是简单的offset, limit。但这通常需要业务层面的支持，插件层面难以完全自动化。
兼容性与扩展性：
- MyBatis版本兼容：MyBatis框架本身也在迭代，内部API可能会有变化。插件需要确保与不同版本的MyBatis保持兼容。
- 与其他插件的冲突：MyBatis拦截器是链式的，如果存在多个拦截器，它们之间的执行顺序和对SQL的修改可能会相互影响，导致意想不到的问题。插件需要设计得足够健壮，能够处理与其他插件的协同工作。
- 自定义SQL增强：有时用户可能需要更灵活的SQL增强方式，而不仅仅是简单的分页。插件是否提供足够的扩展点让用户自定义SQL改写逻辑？
参数处理：
- SQL改写后，原始的BoundSql中的参数映射可能会失效或需要调整。插件需要确保改写后的SQL能够正确地绑定原始参数，并且对于新引入的参数（如Oracle ROWNUM的上下界），也能正确地设置。

实现一个优秀的分页插件，不仅仅是写几行代码那么简单，它需要对MyBatis内部机制、SQL语法、数据库特性以及潜在的性能问题有深刻的理解。

// 概念性代码片段：MyBatis分页插件中SQL改写的大致思路
// 实际插件会比这复杂得多，涉及SQL解析、反射等
public String rewriteSqlForPagination(String originalSql, String dbType, int pageNum, int pageSize) {
    int offset = (pageNum - 1) * pageSize;
    String rewrittenSql = originalSql;

    if ("mysql".equalsIgnoreCase(dbType) || "postgresql".equalsIgnoreCase(dbType)) {
        rewrittenSql += " LIMIT " + offset + ", " + pageSize;
    } else if ("oracle".equalsIgnoreCase(dbType)) {
        // Oracle分页通常需要嵌套查询
        int startRow = offset + 1;
        int endRow = pageNum * pageSize;
        rewrittenSql = "SELECT * FROM (SELECT t.*, ROWNUM rn FROM (" + originalSql + ") t WHERE ROWNUM <= " + endRow + ") WHERE rn >= " + startRow;
    } else {
        // 其他数据库类型...
        throw new UnsupportedOperationException("Unsupported database type for pagination: " + dbType);
    }
    return rewrittenSql;
}

public String rewriteSqlForCount(String originalSql) {
    // 简单的COUNT(*)改写，实际会复杂得多，需要考虑GROUP BY, DISTINCT等
    return "SELECT COUNT(*) FROM (" + originalSql + ") AS total_count_alias";
}

mysql 的内连接、左连接、右连接有什么区别？

一张自增表里面总共有7条数据，删除了最后2条数据，重启 mysql 数据库，又插入了一条数据，此时id 是几？

mybatis 有几种分页方式？

mybatis 分页插件的实现原理是什么？

如何获取当前数据库版本？