Python中换行符在内存中统一为\n,但文件读写时受平台和newline参数影响:Windows文本模式自动转\r\n,Linux/macOS保持\n;splitlines()比split('\n')更安全,能处理各种换行符。

Python中换行符到底是\n还是\r\n
取决于你运行的系统和字符串来源。Python在内存中统一用\n表示换行,但写入文件或与外部交互时,会受newline参数和平台影响。Windows默认文本模式下print()或f.write()会自动把\n转成\r\n;Linux/macOS保持\n不变。
常见误判场景:
- 从Windows记事本复制含
\r\n的文本到Python字符串里,实际是两个字符:'\r\n',不是单个'\n' - 用
open(..., 'r').read()读取Windows生成的文件,若没指定newline='',Python仍按通用换行模式处理(自动识别\r\n/\r/\n并统一转为\n) -
repr(s)能帮你确认真实字符:repr('a\nb')→"'a\\nb'",repr('a\r\nb')→"'a\\r\\nb'"
用splitlines()比split('\n')更安全
str.splitlines()专为换行设计,能正确处理\n、\r\n、\r、\v、\f等所有Unicode行边界,且默认不保留换行符;而split('\n')只切\n,遇到\r\n会留下末尾的\r。
text = "line1\r\nline2\nline3"
print(text.split('\n')) # ['line1\r', 'line2', 'line3']
print(text.splitlines()) # ['line1', 'line2', 'line3']额外注意点:
立即学习“Python免费学习笔记(深入)”;
-
splitlines(keepends=True)可保留换行符,适合需要原样分段再拼接的场景 - 它对空行也有效:
"a\n\nb".splitlines()→['a', '', 'b'] - 不依赖系统
os.linesep,跨平台行为一致
写文件时控制换行符用newline参数
这是最容易被忽略的关键参数。直接写f.write('a\nb')时,如果文件以文本模式打开(默认),Python会根据系统自动转换换行符。要强制输出\n,必须显式指定newline='':
with open('out.txt', 'w', newline='') as f:
f.write('line1\nline2') # 确保写入的是 \n,不是 \r\n对比:
-
open('f.txt', 'w'):Windows下写'\n'→ 文件存'\r\n' -
open('f.txt', 'w', newline=''):无论什么系统,写什么就存什么 -
open('f.txt', 'wb')(二进制模式):同样绕过换行转换,但需传bytes,如b'line1\nline2'
读文件时newline=None(默认)启用通用换行支持;设为''则关闭转换,原样返回所有换行符。
正则匹配换行时别漏掉re.DOTALL
.默认不匹配\n,所以re.search('a.b', 'a\nb')匹配失败。多数人第一反应是改用[\s\S],但更规范的做法是加re.DOTALL标志:
import re text = "start\nmiddle\nend" re.search(r'start.*end', text) # None(默认不跨行) re.search(r'start.*end', text, re.DOTALL) # Match object
其他相关点:
-
^和$默认只匹配字符串首尾,加re.MULTILINE后才匹配每行首尾 - 组合使用:
re.DOTALL | re.MULTILINE - 如果只是简单替换换行,优先用
str.replace('\n', ' '),比正则快且直观
跨平台处理换行最麻烦的往往不是语法,而是混用不同来源的字符串(用户输入、网络响应、文件读取)又没做标准化。建议在数据入口处统一用str.replace('\r\n', '\n').replace('\r', '\n')归一化,后续逻辑就能专注业务,不用反复判断换行符类型。










