根本原因是未指定std::ios::binary标志,导致Windows下文本模式自动转换\r\n和遇0x1A提前终止;还需避免混用C/C++ I/O、结构体直接读写、忽略异常及文本/二进制模式混用。

用 std::ifstream 读二进制文件却读出乱码或数据截断
根本原因通常是没加 std::ios::binary 标志。Windows 下默认文本模式会把 \r\n 自动转成 \n,还可能在遇到 0x1A(EOF 字符)时提前终止读取。
- 务必在打开文件时显式指定
std::ios::binary:std::ifstream file("data.bin", std::ios::in | std::ios::binary); - 检查
file.is_open()和file.good(),不要只依赖构造是否抛异常 - 读取前用
file.seekg(0, std::ios::end); size_t len = file.tellg(); file.seekg(0);获取真实字节长度,避免用file.gcount()误判
fread / fwrite 与 std::streambuf 混用导致缓冲错乱
C 风格 I/O 和 C++ 流共用同一文件描述符但各自维护缓冲区,混用会跳过或重复读写部分字节,尤其在非全缓冲模式下极难复现。
- 一个文件对象只用一种风格:要么全程用
fread/fwrite,要么全程用read()/write()或>>/ - 若必须桥接,调用
file.rdbuf()->pubsync()(C++流)或fflush()(C流)强制刷缓存,再切换 - 注意
std::ofstream默认不缓冲二进制写入,频繁小写建议手动file.rdbuf()->pubsetbuf(buf, size)
结构体直接 read() 写入后跨平台/编译器读取失败
结构体内存布局受对齐(#pragma pack)、字段顺序、大小端、成员类型(如 bool 占几个字节)影响,不同平台或编译选项下 sizeof(MyStruct) 可能不同。
- 禁止直接
file.read(reinterpret_cast传输结构体(&s), sizeof(s)) - 改用序列化:逐字段读写,或用
memcpy+ 显式字节序转换(如htons)处理整数 - 若必须紧凑二进制,统一用
#pragma pack(1)并静态断言:static_assert(sizeof(MyStruct) == 12, "Struct layout changed");
- 写入前用
file.write(...)后立即检查file.gcount() == expected_bytes
未处理 std::ios_base::failure 异常导致程序崩溃
默认情况下 std::ifstream/std::ofstream 不抛异常,但一旦开启 exceptions(std::ios_base::failbit | std::ios_base::badbit),read() 失败、磁盘满、权限不足等都会 throw,没 catch 就 terminate。
立即学习“C++免费学习笔记(深入)”;
- 开启异常前确认你真要它:多数场景用
if (!file) { /* handle */ }更轻量 - 若开启,必须包围所有 I/O 操作:
file.exceptions(std::ios_base::failbit | std::ios_base::badbit); try { file.read(buf, len); } catch (const std::ios_base::failure& e) { // 注意:e.what() 可能不包含具体错误码 int err = errno; // 需在 catch 块内立刻读,errno 可能被后续调用覆盖 } -
std::ios_base::eofbit不触发异常,需单独用file.eof()判断是否读到末尾
实际项目里最常被忽略的是:二进制读写路径中夹杂了任何文本操作(比如用 std::getline 读配置后再切回二进制读),哪怕只调用一次,也会让流进入文本状态并污染后续行为。








