前缀索引是对字符串前N个字符创建索引,用于节省空间并提升查询效率,适用于VARCHAR等长字段;通过计算不同长度下的唯一值比例选择最佳前缀长度,确保高选择性;但不支持ORDER BY、GROUP BY和覆盖索引,需结合业务数据分布权衡长度。

在MySQL中,当字段内容较长时(如VARCHAR(255)),直接对整个字段建立索引会占用大量存储空间,并降低写入性能。这时可以使用前缀索引,即只对字段的前N个字符建立索引,从而节省空间并提升性能。
什么是前缀索引
前缀索引是指对字符串类型的列,只取其前面的一部分字符来创建索引。例如:
CREATE INDEX idx_name ON users(name(10));这条语句为 users 表的 name 字段前10个字符建立索引。适合用于像姓名、邮箱、URL等有明显前缀区分度的字段。
如何选择合适的前缀长度
前缀太短可能导致区分度低,产生大量重复值,影响查询效率;前缀太长则失去了节省空间的意义。可以通过以下方法评估最佳长度:
- 统计不同前缀长度下的唯一值比例:
COUNT(DISTINCT LEFT(email, 5)) / COUNT(*) AS sel5,
COUNT(DISTINCT LEFT(email, 6)) / COUNT(*) AS sel6,
COUNT(DISTINCT LEFT(email, 7)) / COUNT(*) AS sel7,
COUNT(DISTINCT LEFT(email, 8)) / COUNT(*) AS sel8
FROM users;
目标是让这个比值尽量接近 1(即高选择性)。比如当长度为7时达到95%以上,就可以考虑使用7作为前缀长度。
前缀索引的限制与注意事项
- 不能用于 ORDER BY 和 GROUP BY,因为索引不包含完整数据
- 不能用于覆盖索引查询(即无法避免回表)
- 对于BLOB/TEXT类型,必须指定前缀长度才能建索引
- 中文字段需注意字符编码:utf8mb4下每个汉字占4字节,应按实际字节数计算
优化建议
- 优先在高频查询且数据较长的字段上使用前缀索引
- 结合业务数据分布测试前缀长度,找到“选择性”和“空间”的平衡点
- 可配合普通索引使用,复杂查询可通过组合策略优化
- 定期分析表数据变化,必要时调整前缀长度
基本上就这些。前缀索引是一种以空间换效率的折中方案,在合理设计下能显著提升大字段查询性能,但要避免盲目使用。关键是根据实际数据选择最优前缀长度。










