最常用且通用的方法是 ' '.join(s.split()),它按任意空白字符切分再拼接,自动去除首尾及中间多余空白,适合清洗不可控输入。

用 replace() 最快但不精准
如果只是想把所有空格(包括连续多个)替换成单个空格,replace(' ', '') 会直接删光,而 replace(' ', ' ') 没用。真正常用的是 replace(' ', ' ') 反复调用——但这不是函数,也不鲁棒。
更实际的做法是:若确定只处理 ASCII 空格(U+0020),且不需要动制表符、换行等,可用 re.sub(r' +', ' ', s).strip()。注意它保留首尾单空格,所以得额外 strip()。
-
re.sub(r' +', ' ', 'a b c')→'a b c' - 对含
\t或\n的字符串无效 - 正则有轻微性能开销,但对千字符以内几乎无感
用 split() + join() 最通用
这是最常被推荐、也最不容易出错的方式:它把所有空白字符(空格、制表、换行、回车)当分隔符切开,再用单空格拼回去。天然过滤首尾空白和中间多余空白。
s = " hello\t world\n python " result = ' '.join(s.split()) # result → "hello world python"
-
s.split()不带参数时才按任意空白切,带''或' '反而失效 - 会把
\u3000(中文全角空格)当成普通字符,不会清除 - 适合清洗用户输入、日志文本等不可控空白来源的场景
要保留部分空白?得手动遍历或正则控制
比如只删“单词之间超过 1 个的空格”,但保留单空格;或跳过引号内的空格(如 SQL 字符串字面量)。这时 split/join 失效,必须用正则或状态机。
立即学习“Python免费学习笔记(深入)”;
简单情况可用 re.sub(r' {2,}', ' ', s),只压缩两个及以上连续空格:
re.sub(r' {2,}', ' ', 'a b c') # → 'a b c'
re.sub(r' {2,}', ' ', 'a b c') # → 'a b c'(不变)- 正则中的
{2,}表示“至少两个”,比+更精确 - 仍不处理
\t,要支持就得写成r'[ \t\n\r]{2,}' - 如果字符串里有需要保留的缩进(如代码块),这种粗粒度替换会破坏结构
自定义函数别忘了边界情况
写一个叫 remove_extra_spaces 的函数时,最容易漏的是空字符串、纯空白、None 输入。
def remove_extra_spaces(s):
if not isinstance(s, str):
return s
return ' '.join(s.split()) if s.strip() else ''- 没判
None?运行时抛AttributeError - 没判
''或'\t\n '?s.split()返回[],' '.join([])是'',其实可接受,但显式处理更清晰 - 返回类型最好和输入一致——如果传入
bytes,别硬转str
' '.join(s.split()) 就够了;真要封装函数,重点不是逻辑,是防御性检查。










