PHP连接MySQL中文乱码需同时确保连接层(mysqli_connect第五参数或PDO DSN加charset=utf8mb4)、表结构(建表/修改时显式指定CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci)及客户端三者编码一致,缺一不可。

PHP 连接 MySQL 出现中文乱码,90% 是因为连接层、表结构、客户端三者编码不一致,不是改一个地方就能解决的。关键在 SET NAMES、连接时指定字符集、以及建表时的 CHARACTER SET 三者协同生效。
mysqli_connect() 连接时必须显式指定 charset
只靠 mysql_set_charset()(已废弃)或 mysqli::set_charset() 后置调用,无法覆盖某些驱动初始化时的默认行为。必须在连接后立即设置,或更稳妥地在 mysqli_connect() 第五个参数传入 "utf8mb4":
$conn = mysqli_connect($host, $user, $pass, $db, $port, $socket); mysqli_set_charset($conn, "utf8mb4"); // 必须紧接连接后执行
或者一步到位:
$conn = mysqli_connect($host, $user, $pass, $db, $port, $socket, ["charset" => "utf8mb4"]); // PHP 8.1+ 支持数组选项
注意:"utf8" 在 MySQL 中实际是 utf8mb3,不支持 emoji 和部分生僻汉字;生产环境一律用 "utf8mb4"。
立即学习“PHP免费学习笔记(深入)”;
PDO 连接 DSN 必须带 charset 参数
PDO 不会自动读取 MySQL 配置里的 default-character-set,DSN 中漏掉 ;charset=utf8mb4 就等于没设:
-
mysql:host=localhost;dbname=test→ ❌ 默认用 latin1,中文必乱 -
mysql:host=localhost;dbname=test;charset=utf8mb4→ ✅ 正确 - 如果使用 Unix socket 或端口,
charset必须放在最后,否则可能被忽略
同时建议加上 PDO::ATTR_EMULATE_PREPARES => false,避免预处理语句绕过字符集校验。
建表和字段必须声明 COLLATE,不能只靠数据库默认值
即使连接用了 utf8mb4,如果表或字段定义没指定 COLLATE,MySQL 可能沿用旧库的 latin1_swedish_ci:
- 创建新表时,显式写:
CREATE TABLE t (name VARCHAR(255)) CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci; - 修改已有表:
ALTER TABLE t CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci; - 只改字段:
ALTER TABLE t MODIFY name VARCHAR(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
别依赖 SHOW CREATE DATABASE db 的输出——它只反映库级默认值,不保证表/列实际生效。
php.ini 和 my.cnf 的配置只是基础,不能替代运行时设置
php.ini 中的 mysql.default_charset = utf8mb4 对 mysqli 无效;my.cnf 的 [client] 段设置只影响命令行客户端,不影响 PHP 进程。真正起作用的是:
- 连接建立时的显式字符集参数(DSN 或
mysqli_connect选项) - 连接后立刻执行的
SET NAMES utf8mb4(等价于SET character_set_client = utf8mb4; SET character_set_results = utf8mb4; SET character_set_connection = utf8mb4;) - 表结构本身存储的字符集元数据
调试时用 mysqli_query($conn, "SHOW VARIABLES LIKE 'character_set%';") 查当前连接的实际编码,比看配置文件更可靠。











