0

0

C++二进制文件与文本文件区别及使用场景对比

裘德小鎮的故事

裘德小鎮的故事

发布时间:2026-01-19 17:03:08

|

612人浏览过

|

来源于php中文网

原创

必须使用ios::binary标志,否则Windows下会错误转换换行符(\n↔\r\n)并遇\x1A截断,导致图片、音频等二进制数据损坏;应显式指定该标志,避免文本模式干扰。

c++二进制文件与文本文件区别及使用场景对比

二进制文件读写必须用 ios::binary 标志

不加这个标志,ifstreamofstream 会默认按文本模式处理:Windows 下自动把 \n 转成 \r\n,读取时又反向转换;遇到 \x1A(EOF 字符)直接截断。这对图片、音频、序列化对象等二进制数据是灾难性的。

实操建议:

  • 所有二进制 I/O 必须显式指定 ios::binary,例如:ofstream fout("data.bin", ios::binary);
  • 文本文件可以省略该标志,但加上也无害;混用会导致不可预测的换行/截断问题
  • fread/fwrite(C 风格)默认就是二进制,无需额外设置,但需注意平台字节序和结构体对齐

std::stringstd::vector 适合做二进制缓冲区

文本文件常用 std::string 存行或小段内容,但二进制数据可能含 \0 字节,std::stringc_str() 或构造函数会误判为结尾。更安全的是用 std::vectorstd::basic_string(保留空字符)。

常见错误现象:

立即学习C++免费学习笔记(深入)”;

  • std::string s(buf, len) 构造二进制数据,但 buf 中有 \0 → 实际只拷贝到第一个 \0
  • s.data() 传给 write() 却没传长度 → 写入长度被 \0 截断

正确做法:

MaxAI
MaxAI

MaxAI.me是一款功能强大的浏览器AI插件,集成了多种AI模型。

下载
std::vector buf(1024);
fin.read(buf.data(), buf.size()); // 显式传长度
// 或
std::string bin_data;
bin_data.assign(buf.begin(), buf.end()); // 不依赖 \0 终止

文本文件适合人读,二进制文件适合机器高效存取

文本文件(如 JSON、CSV、XML)可直接用编辑器查看、grep 搜索、Git diff 对比,但解析慢、体积大;二进制文件(如 Protocol Buffers、自定义结构体 write(reinterpret_cast(&x), sizeof(x)))体积小、读写快,但无法直读、不可 diff、跨平台需处理字节序和对齐。

使用场景判断:

  • 日志、配置、用户可见数据 → 文本优先
  • 游戏资源包、传感器原始采样、网络协议载荷、高频序列化 → 二进制优先
  • 需要长期存档或跨语言互通 → 选带 schema 的二进制格式(如 FlatBuffers),别手写 memcpy

结构体写入二进制文件前必须考虑内存对齐与字节序

直接 write() 一个结构体,看似简单,实际埋雷:编译器插入填充字节(padding),不同平台结构体布局可能不同;多字节整数在 x86 是小端,ARM 可能是大端。

容易踩的坑:

  • 结构体含 boolcharint 混排 → 实际大小 ≠ 成员字节和,sizeof(S) 不等于你算出来的值
  • #pragma pack(1) 强制紧凑对齐 → 解决 padding,但可能降低访问性能,且需两端一致
  • 跨平台传输整数 → 必须用 htons()/htonl() 或手动翻转字节,不能直接写 int32_t

示例(安全写入紧凑结构):

struct __attribute__((packed)) Header {
    uint32_t magic;   // 网络序写入
    uint16_t version;
};
Header h = {htons(0x1234), htons(1)};
fout.write(reinterpret_cast(&h), sizeof(h));
二进制文件的“高效”是以牺牲可读性、可移植性和调试便利性换来的,真正上线前务必验证字节序、对齐、边界条件——尤其是从文件读回结构体后,检查每个字段是否符合预期。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

412

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

533

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

310

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

75

2025.09.10

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

318

2023.08.02

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1885

2024.04.01

xml怎么变成word
xml怎么变成word

步骤:1. 导入 xml 文件;2. 选择 xml 结构;3. 映射 xml 元素到 word 元素;4. 生成 word 文档。提示:确保 xml 文件结构良好,并预览 word 文档以验证转换是否成功。想了解更多xml的相关内容,可以阅读本专题下面的文章。

2087

2024.08.01

xml是什么格式的文件
xml是什么格式的文件

xml是一种纯文本格式的文件。xml指的是可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。想了解更多相关的内容,可阅读本专题下面的相关文章。

1017

2024.11.28

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

11

2026.01.19

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
WEB前端教程【HTML5+CSS3+JS】
WEB前端教程【HTML5+CSS3+JS】

共101课时 | 8.4万人学习

JS进阶与BootStrap学习
JS进阶与BootStrap学习

共39课时 | 3.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号