0

0

c++中如何判断两个文件内容是否完全一致_c++文件流对比方法【详解】

裘德小鎮的故事

裘德小鎮的故事

发布时间:2026-01-18 16:00:02

|

730人浏览过

|

来源于php中文网

原创

最稳妥的方式是用std::ifstream以二进制模式逐块读取并比较:先用std::filesystem::file_size快速过滤大小不同的文件,再分块读入缓冲区,同步校验gcount()并用std::equal进行字节级比对。

c++中如何判断两个文件内容是否完全一致_c++文件流对比方法【详解】

std::ifstream 逐块读取并比较是最稳妥的方式

直接用 std::filesystem::file_size 判断大小是否相等只是第一道过滤,不能代替内容比对。真正可靠的方法是打开两个文件为二进制流,分块读入缓冲区,逐块 memcmp 或用 std::equal 比较。这样既避免内存爆炸(不一次性加载整个文件),又保证字节级一致。

  • 必须以 std::ios::binary 模式打开,否则 Windows 下换行符会被隐式转换,导致误判
  • 缓冲区大小建议设为 4096 或 8192,太小增加系统调用开销,太大无必要
  • 需同步检查两次 read()gcount():若两文件最后一块长度不同,立即返回 false
  • 任一文件提前 EOF 或读取失败(!ifs1 || !ifs2),即不一致
#include 
#include 
#include 

bool files_equal(const std::string& p1, const std::string& p2) { std::ifstream f1(p1, std::ios::binary); std::ifstream f2(p2, std::ios::binary); if (!f1 || !f2) return false;

const size_t buf_size = 8192;
std::vectorzuojiankuohaophpcncharyoujiankuohaophpcn buf1(buf_size), buf2(buf_size);

while (f1.good() && f2.good()) {
    f1.read(buf1.data(), buf_size);
    f2.read(buf2.data(), buf_size);
    size_t n1 = static_castzuojiankuohaophpcnsize_tyoujiankuohaophpcn(f1.gcount());
    size_t n2 = static_castzuojiankuohaophpcnsize_tyoujiankuohaophpcn(f2.gcount());
    if (n1 != n2 || !std::equal(buf1.begin(), buf1.begin() + n1, buf2.begin())) {
        return false;
    }
}
return f1.eof() && f2.eof();

}

std::filesystem::file_size 快速排除明显不同的文件

如果两个文件大小不同,内容必然不同。这个检查耗时极短,应作为前置步骤。但注意:std::filesystem::file_size 在某些旧编译器(如 GCC -std=c++17 时不可用;Windows 上需确保路径编码正确(推荐 UTF-8 + std::filesystem::u8path)。

  • 调用前先检查文件是否存在且可访问,否则抛 std::filesystem::filesystem_error
  • 不要依赖 stat() 等 C 接口获取大小——跨平台行为不一致,且可能受文件系统精度影响(如稀疏文件)
  • 大小相同 ≠ 内容相同,仅用于快速剪枝

遇到“Permission denied”或“Operation not permitted”怎么办

常见于尝试读取系统文件、符号链接目标不可达、或文件被其他进程独占锁定(如 Windows 上 Excel 正在编辑的 .xlsx)。此时 std::ifstream 构造失败,failbit 被置位。

Designs.ai
Designs.ai

AI设计工具

下载

立即学习C++免费学习笔记(深入)”;

  • if (!ifs) { /* 检查 ifs.rdstate() */ } 获取具体失败原因
  • Linux/macOS 可用 access(path.c_str(), R_OK) 预检读权限;Windows 建议用 GetFileAttributes 配合 FILE_ATTRIBUTE_READONLY
  • 跳过符号链接本身(而非其目标):用 std::filesystem::is_symlink(p) && !std::filesystem::is_regular_file(p) 过滤

为什么不用 std::hash<:string> 或 MD5 计算哈希再比较

哈希适合远距离比对(如网络传输后校验),但在本地文件一致性判断中属于过度设计。它引入额外计算开销(尤其大文件),且无法短路:哪怕第一个字节就不同,仍要算完整个哈希值。

  • MD5/SHA 等哈希函数不提供增量中断接口,无法在发现差异时立刻返回
  • 哈希碰撞虽概率极低,但严格意义上不等于“字节一致”——而你的需求是确定性判定
  • 若真要用哈希,务必用二进制模式读取,避免文本模式换行符干扰

实际使用时,最容易被忽略的是二进制模式和最后一块长度校验。很多实现只比到 eof(),却没检查最后一次 read() 是否读满,导致两个文件末尾一个多了几个零字节也判为相等。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

318

2023.08.02

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

746

2023.08.22

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

746

2023.08.22

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1023

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

66

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

429

2025.12.29

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

578

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1102

2023.07.27

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

43

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.4万人学习

Git 教程
Git 教程

共21课时 | 2.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号