最推荐用 str.isprintable() 判断字符串是否含不可打印字符,它返回 True 当且仅当非空且全为可打印字符;空字符串返回 False,控制符、零宽字符、组合符等均被识别为不可打印。

Python 中判断字符串是否包含不可打印字符,最直接的方式是检查每个字符的 Unicode 类别或使用 str.isprintable() 方法——它专为此设计,且行为明确、性能好。
用 str.isprintable() 快速判断
这是最推荐的方法。该方法返回 True 当且仅当字符串非空且所有字符都是可打印的(不含控制字符、换行符、制表符等),空字符串也返回 False。
-
"hello"→True -
"hello\n"→False(含换行符) -
"hello\t"→False(含制表符) -
""→False(空字符串不视为可打印) -
"hello\x00world"→False(含空字符)
定位具体不可打印字符(调试用)
若需知道哪些字符不可打印,可遍历字符串,结合 unicodedata.category() 或直接比对控制字符范围:
- 控制字符的 Unicode 类别以
C开头(如Cc控制符、Cf格式符、Co私有使用、Cn未分配) - 常用做法:导入
unicodedata,对每个字符调用unicodedata.category(c).startswith('C') - 简单替代:检查
ord(c) (粗略过滤 ASCII 控制符,但不覆盖 Unicode 全集)
注意边界情况
某些字符看似“空白”,实则不可打印,容易被忽略:
立即学习“Python免费学习笔记(深入)”;
- 零宽空格(
\u200b)、零宽非连接符(\u200c)、左至右标记(\u200e)等 —— 它们属于Cf类,isprintable()返回False - 全角空格(
\u3000)是可打印的(属于Zs分隔符),isprintable()返回True - 组合字符(如重音符号
\u0301)属于Mn(标记-非间距),isprintable()返回False
实用检测函数示例
封装一个兼顾判断与提示的函数:
import unicodedata
def has_non_printable(s):
if not isinstance(s, str):
return False
if not s:
return False
return not s.isprintable()
def find_non_printable_chars(s):
return [
(i, c, unicodedata.category(c), f'U+{ord(c):04X}')
for i, c in enumerate(s)
if unicodedata.category(c).startswith('C') or ord(c) == 0
]











