中文乱码是因字符集未统一,需三步解决:一、数据库层设utf8mb4;二、PHP连接时用set_charset或DSN指定utf8mb4;三、PHP文件存为UTF-8无BOM并声明响应头。

如果您在使用PHP进行数据库增删改查操作时遇到中文显示为问号或方块等乱码现象,则很可能是由于字符集未统一导致的编码不匹配。以下是解决此问题的具体步骤:
一、确保数据库及数据表使用UTF-8字符集
MySQL默认字符集可能为latin1,若未显式指定UTF-8,插入中文将被截断或转为乱码。需确认并修改数据库、表、字段的字符集配置。
1、登录MySQL命令行或phpMyAdmin,执行:ALTER DATABASE your_database_name CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;
2、修改已有数据表字符集:ALTER TABLE your_table_name CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
立即学习“PHP免费学习笔记(深入)”;
3、对已存在字段单独调整(如name字段):ALTER TABLE your_table_name CHANGE name name VARCHAR(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
二、PHP连接层设置正确的字符集
PHP通过mysqli或PDO连接MySQL时,必须在建立连接后立即设置客户端字符集,否则即使数据库是UTF-8,传输过程仍按默认编码解析。
1、使用mysqli面向对象方式时,在new mysqli()之后调用:$mysqli->set_charset("utf8mb4");
2、使用mysqli过程式方式时,在mysql_connect()后执行:mysqli_set_charset($connection, "utf8mb4");
3、使用PDO时,在DSN中添加charset参数:$pdo = new PDO("mysql:host=localhost;dbname=test;charset=utf8mb4", $user, $pass);
三、PHP文件与HTML输出声明UTF-8编码
PHP脚本自身源码若保存为非UTF-8编码(如GBK),或HTTP响应头未声明字符集,浏览器将无法正确解码中文内容。
1、用编辑器(如VS Code、Notepad++)将PHP文件另存为UTF-8无BOM格式。
2、在PHP脚本开头(header('Content-Type: text/html; charset=utf-8');
3、在HTML的
中加入meta声明:四、表单提交与GET/POST数据接收时的编码处理
浏览器发送表单数据时若页面编码为UTF-8,但PHP未以对应方式读取,可能导致$_POST或$_GET中的中文变为乱码。
1、确保表单所在HTML页面已声明UTF-8(见第三部分第3步)。
2、禁止对$_POST或$_GET值做iconv或mb_convert_encoding等手动转码,除非明确知道原始编码且必要。
3、如需兼容旧环境且确认输入为GBK,可临时检测并转换:if (mb_detect_encoding($_POST['text']) !== 'UTF-8') { $_POST['text'] = mb_convert_encoding($_POST['text'], 'UTF-8', 'GBK'); }
五、检查MySQL服务器全局配置
仅修改数据库和连接层不足以根治乱码,还需确认MySQL服务端默认字符集是否为utf8mb4,否则新创建的数据库仍会继承错误设置。
1、查看当前全局变量:SHOW VARIABLES LIKE 'character_set%';
2、编辑MySQL配置文件(my.cnf或my.ini),在[mysqld]段下添加:character-set-server = utf8mb4
3、在[client]和[mysql]段下添加:default-character-set = utf8mb4











