c++中如何实现简单的文件分块读取_c++大文件处理技巧【实例】

尼克

发布时间：2026-01-16 17:39:37

745人浏览过

来源于php中文网

原创

不能直接用fread一次性读完大文件，因32位程序无法分配4GB单块缓冲区，64位下也易阻塞线程、触发OOM，且多数场景无需全量驻留内存；应分块读取并正确处理边界与EOF。

c++中如何实现简单的文件分块读取_c++大文件处理技巧【实例】

为什么不能直接用 `fread` 一次性读完大文件

内存不够是硬限制。比如一个 4GB 的日志文件，在 32 位程序里根本无法分配单块 4GB 缓冲区；即使在 64 位下，一次性加载也会阻塞主线程、拖慢响应，还可能触发系统 OOM Killer。更关键的是，多数场景（如校验、过滤、流式解析）根本不需要全量驻留内存。

用 `fseek` + `fread` 分块读取的可靠写法

核心是控制每次读取的字节数，并正确处理边界和 EOF。注意：不能依赖 fread 返回值等于请求长度来判断是否读完——最后一块通常不足。

fseek(fp, offset, SEEK_SET) 定位到起始位置，offset 必须是 long 类型，超 2GB 文件需确保编译器支持 _FILE_OFFSET_BITS=64（Linux）或使用 _fseeki64（Windows）
每次调用 fread(buf, 1, chunk_size, fp) 后，检查返回值 size_t n = fread(...)，它表示**实际读到的字节数**，可能为 0（EOF 或出错）
读完一块后不要立刻 fseek 到下一块——应基于本次 n 计算下一次 offset，避免因换行符、编码边界等导致跳过数据

FILE* fp = fopen("huge.log", "rb");
if (!fp) return;
const size_t chunk_size = 64 * 1024; // 64KB
char* buf = new char[chunk_size];
size_t offset = 0;
while (true) {
fseek(fp, offset, SEEK_SET);
size_t n = fread(buf, 1, chunk_size, fp);
if (n == 0) break; // EOF or error
// 处理 buf[0..n-1]
process_chunk(buf, n);

offset += n; // 下一块从当前位置开始，不跳字节
}
delete[] buf;
fclose(fp);
用 std::ifstream 分块时必须避开的坑
std::ifstream 默认启用缓冲，但 read() 在二进制模式下行为与 C 风格一致；问题多出在文本模式（自动换行转换）、异常掩码未关闭、以及 gcount() 被忽略。

务必调用 file.open("...", std::ios::binary)，否则 Windows 下 \r\n 可能被误转为 \n，破坏原始字节偏移
不要用 file >> 或 getline() 处理大文件——它们内部会反复调用 sbumpc()，性能极差且无法控制块大小
每次 read(buf, size) 后，必须用 file.gcount() 获取真实读取字节数，file.fail() 和 file.eof() 需配合判断：仅当 gcount() == 0 && !fail() 才是干净 EOF

分块大小选 64KB 还是 1MB？看 I/O 模式和设备
不是越大越好。机械硬盘随机读取 1MB 块可能比顺序读慢 20%，而 SSD 上差异不大；但内存拷贝开销、cache line 对齐、以及下游处理单元（如解压、加密）的吞吐瓶颈更关键。

							
								
								
									Smart Picture
									Smart Picture 智能高效的图片处理工具
								
								下载 
							
						
立即学习“C++免费学习笔记（深入）”；

纯顺序扫描（如统计行数）：64KB ~ 256KB 平衡了系统调用开销和 cache 效率
需要按固定结构解析（如 protobuf record）：块尾需预留至少一个完整 record 长度，避免跨块截断，此时建议 1MB + 边界对齐逻辑
网络文件系统（NFS/SMB）：小块（8KB~32KB）更稳定，大块易触发 timeout 或重传

真正难的不是怎么读，而是怎么定义“块”——是按字节切分，还是按逻辑记录切分；后者要求预读+回退机制，容易漏掉跨块的换行或帧头。

如何使用c++的std::chrono库进行精确的时间测量？ (高精度计时)

c++中如何设置控制台颜色_c++修改命令行输出颜色的方法【详解】

C++如何使用Valgrind检测内存泄漏？（Linux工具）

如何使用CMake为ARM平台交叉编译c++项目？ (Toolchain文件配置)

c++的动态库(.so/.dll)符号可见性如何控制？ (__attribute__((visibility("default"))))

c++速学教程(入门到精通)

c++怎么学习？c++怎么入门？c++在哪学？c++怎么学才快？不用担心，这里为大家提供了c++速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

linux windows 编码字节硬盘机械硬盘 ai c++ ios 解压 win stream 为什么 EOF fclose ifstream 线程主线程 delete windows ios linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：c++中如何使用stringstream_c++字符串流进行数据转换【实例】下一篇：c++中如何处理中文乱码_c++控制台输出中文乱码解决方法【详解】

作者最新文章

电脑开机进入bios界面进不去系统怎么办_bios跳过方法【教程】

2026-01-16 10:20

c++如何使用gRPC实现高性能RPC服务？ (Protobuf基础)

2026-01-16 10:20

Linux怎么配置VLAN_Linux虚拟局域网划分与管理【网络进阶】

2026-01-16 10:22

PS修复画笔工具怎么用 Photoshop去除人物面部瑕疵【技巧】

2026-01-16 10:27

Excel如何实现多条件求和 SUMIFS函数详细用法【销售统计】

2026-01-16 10:29

互动作业怎么用翻译功能_互动作业中英文互译使用技巧【教程】

2026-01-16 10:32

汽车之家app怎么筛选新能源汽车？汽车之家app找车频道筛选技巧【详解】

2026-01-16 10:40

MAC如何进入恢复模式_MAC系统急救与抹除数据方法【科普】

2026-01-16 10:50

composer中如何检测PHP版本兼容性_composer检查环境要求方法【实战】

2026-01-16 10:58

Win11怎么设置定时开机_Win11主板BIOS配合系统唤醒教程【指南】

2026-01-16 11:05

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

fclose函数的用法

fclose是一个C语言和C++中的标准库函数，用于关闭一个已经打开的文件，是文件操作中非常重要的一个函数，用于将文件流与底层文件系统分离，释放相关的资源。更多关于fclose函数的相关问题，详情请看本专题下面的文章。php中文网欢迎大家前来学习。

326

2023.11.30

线程和进程的区别

线程和进程的区别：线程是进程的一部分，用于实现并发和并行操作，而线程共享进程的资源，通信更方便快捷，切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

480

2023.08.10

线程和进程的区别

480

2023.08.10

数据库Delete用法

数据库Delete用法：1、删除单条记录；2、删除多条记录；3、删除所有记录；4、删除特定条件的记录。更多关于数据库Delete的内容，大家可以访问下面的文章。

269

2023.11.13

drop和delete的区别

drop和delete的区别：1、功能与用途；2、操作对象；3、可逆性；4、空间释放；5、执行速度与效率；6、与其他命令的交互；7、影响的持久性；8、语法和执行；9、触发器与约束；10、事务处理。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

209

2023.12.29

windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口，端口号的范围从0到65535，比如用于浏览网页服务的80端口，用于FTP服务的21端口等等。怎么查看windows端口占用情况呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

576

2023.07.26