Python中读写二进制文件需用'rb'或'wb'等带'b'的模式,配合bytes类型操作,读取时返回bytes对象,可分块处理大文件,写入时需确保数据为bytes类型,避免编码错误,注意文件会被覆盖或追加。

Python 中读取和写入二进制文件非常直接,关键在于使用正确的模式打开文件,并配合 bytes 类型进行操作。二进制文件包括图片、音频、视频、可执行文件等非文本数据,不能用普通文本方式处理。
打开二进制文件的模式
在使用 open() 函数时,通过添加 'b' 标志来指定以二进制模式操作:
- 'rb':以二进制格式读取文件
- 'wb':以二进制格式写入文件(会覆盖原有内容)
- 'ab':以二进制格式追加写入
- 'r+b':以二进制格式读写
读取二进制文件
使用 'rb' 模式打开文件后,调用 read() 方法获取字节内容:
with open('example.jpg', 'rb') as f:
data = f.read()
print(type(data)) #
也可以分块读取,避免大文件占用过多内存:
立即学习“Python免费学习笔记(深入)”;
chunk_size = 1024
with open('large_file.bin', 'rb') as f:
while chunk := f.read(chunk_size):
process(chunk) # 处理每一块数据
写入二进制文件
要将 bytes 写入文件,使用 'wb' 模式。注意如果文件已存在会被覆盖:
binary_data = b'\x48\x65\x6c\x6c\x6f' # bytes 对象
with open('output.bin', 'wb') as f:
f.write(binary_data)
若需追加内容,改用 'ab' 模式即可:
with open('output.bin', 'ab') as f:
f.write(b'\x20\x57\x6f\x72\x6c\x64') # 追加 " World"
常见注意事项
处理二进制数据时要注意以下几点:
- 必须使用 bytes 或 bytearray 类型进行写入,字符串需先编码
- 不要在二进制模式下使用文本相关参数如 encoding
- 读取结果是不可变的 bytes,如需修改可用 bytearray
- 某些文件格式有特定结构(如 PNG 头部),写入时需遵循规范
基本上就这些。只要记住用 'b' 模式并操作 bytes 类型,就能正确处理各类二进制文件。不复杂但容易忽略细节。










