分表路由表本质是PHP代码定义的业务规则映射,非数据库内置功能;需用稳定分片键(如user_id)和可逆算法(如$user_id % 100)实现一致路由,并封装为幂等、可验证的函数。

分表路由表的本质是业务规则映射,不是数据库功能
PHP 本身不提供“分表路由表”这种内置结构,所谓路由表,实际是你用 PHP 代码定义的分片逻辑(比如 user_id % 16 路由到 users_00),再配合手动建表或迁移脚本生成物理表。数据库(如 MySQL)只看到一堆独立表,它完全不知道它们是“分表”,更不存在自动路由机制。
建表前必须确定分片键和分片算法
路由是否可靠,取决于分片键(shard key)是否稳定、可预测,以及算法是否可逆。常见错误是用 UUID 或自增 ID 做分片键却没预分配,导致无法定位数据;或用时间字段分片但未统一时区,造成跨表查询混乱。
-
user_id是最常用分片键:整型、全局唯一、写入均匀 - 推荐算法:
$table_suffix = sprintf('%02d', $user_id % 100)(100 张表) - 避免用
md5($user_id) % 100:PHP 的md5返回字符串,取模会隐式转为 0,结果全进第一张表 - 建表语句需带后缀:
CREATE TABLE users_00 (id BIGINT PRIMARY KEY, ...)
PHP 中实现路由逻辑要封装成可复用函数
不要在每个 DAO 方法里重复写 $user_id % 16,应抽象为一个明确命名的路由函数,并确保读写一致。否则容易出现写入 users_07、查询却去 users_08 的问题。
function get_user_table_name(int $user_id, int $shard_count = 16): string
{
$suffix = $user_id % $shard_count;
return 'users_' . str_pad((string) $suffix, 2, '0', STR_PAD_LEFT);
}
// 使用示例
$table = get_user_table_name(12345); // 返回 'users_09'
$sql = "INSERT INTO {$table} (id, name) VALUES (?, ?)";
注意:该函数必须在所有服务节点上行为一致(比如不能依赖本地配置差异),上线前务必用全量 user_id 样本做哈希分布验证。
立即学习“PHP免费学习笔记(深入)”;
建表脚本要支持幂等性和版本追踪
直接手写 100 条 CREATE TABLE 不可维护。应生成带版本号的建表脚本,每次执行前检查目标表是否存在,且记录已应用的版本(比如写入 shard_migrations 表)。
- 避免用
CREATE TABLE IF NOT EXISTS:它不校验表结构是否匹配,字段变更会被跳过 - 建表语句中显式指定字符集:
ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci - 索引策略需统一:所有分表都必须有
PRIMARY KEY(id)和INDEX idx_user_id (user_id),否则路由失效
复杂点在于跨分表聚合查询——PHP 层没法自动合并结果,得靠业务妥协(比如放弃实时总页数)或引入中间层(如 MyCat、Vitess)。这点最容易被忽略,直到上线后才发现报表跑不出来。











