Python默认支持中文,但终端编码(如Windows cmd默认GBK)、文件未声明UTF-8编码、open()未指定encoding、子进程/日志/Web响应等输出通道编码不匹配,会导致UnicodeEncodeError或乱码。

Python 程序默认能输出中文,但实际运行时经常出现 UnicodeEncodeError 或乱码,根本原因不是 Python 不能处理中文,而是终端/控制台、文件编码、IDE 输出通道或系统 locale 设置不匹配。
Windows 控制台默认不支持 UTF-8(尤其旧版 cmd)
cmd 默认使用 GBK 编码,而 Python 3 字符串是 Unicode,print("你好") 会尝试用系统编码(GBK)输出 UTF-8 字节流,导致报错或显示为乱码。
- 临时解决:在脚本开头加
import io import sys sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')
- 更稳妥做法:启动 cmd 前执行
chcp 65001(切换为 UTF-8 模式),再运行脚本 - PowerShell 默认支持 UTF-8,推荐替代 cmd;VS Code 的集成终端也默认 UTF-8,但需确认设置:
"terminal.integrated.defaultProfile.windows": "PowerShell"
Python 文件本身没声明编码
如果源文件含中文字符(如字符串字面量、注释),且未声明编码,Python 2 会报错,Python 3 虽默认 UTF-8,但某些编辑器保存时可能用 GBK,造成运行时解码失败。
- 必须在文件第一行或第二行加编码声明:
# -*- coding: utf-8 -*-
- VS Code、PyCharm 默认以 UTF-8 保存,但右下角状态栏要确认显示的是
UTF-8,不是GBK或ISO-8859-1 - 用
file -i your_script.py(Linux/macOS)或xxd -l 20 your_script.py查看实际 BOM 或编码字节
写入文件时没指定 encoding 参数
open("out.txt", "w").write("你好") 在 Windows 上可能因默认编码是 cp1252 或 gbk 导致写入失败或乱码。
立即学习“Python免费学习笔记(深入)”;
- 显式指定编码是必须的:
with open("out.txt", "w", encoding="utf-8") as f: f.write("你好") - 不要依赖
sys.getdefaultencoding()—— 它返回'utf-8',但不控制文件 I/O 编码 - 若需兼容 Windows 记事本(它依赖 BOM 识别 UTF-8),可写为
encoding="utf-8-sig"
print() 输出到非终端环境(如日志、管道、Web 响应)
在 Flask、Django 或 subprocess 调用中,print() 可能被重定向到无编码信息的 buffer,或接收方(如 nginx、logrotate)按错误编码解析。
- Web 框架中优先用响应对象设置 charset:
return Response("你好", content_type="text/plain; charset=utf-8") - 子进程捕获输出时,用
subprocess.run(..., encoding="utf-8", stdout=subprocess.PIPE) - 日志模块要配置
handlers的encoding="utf-8",否则FileHandler可能用系统默认编码写入
真正卡住人的往往不是“怎么让 Python 显示中文”,而是某个环节静默用了错误编码——比如 IDE 终端设对了,但你用 python script.py > out.log 重定向时,cmd 自己又切回 GBK;或者文件写了 UTF-8,但双击用记事本打开没 BOM 就当 ANSI 解析。盯住每个数据出口的 encoding 显式声明,比全局改系统设置更可靠。










