c++中如何实现文件的按行排序_c++读取文件并排序内容【详解】

裘德小鎮的故事

发布时间：2026-01-22 16:18:27

176人浏览过

来源于php中文网

原创

用std::getline逐行读取最稳妥，自动剥离换行符并处理\r；需手动跳过UTF-8 BOM；空行保留与否依业务而定；排序前应按需实现去空格、忽略大小写或自然排序；写回时注意换行符一致性和BOM控制。

c++中如何实现文件的按行排序_c++读取文件并排序内容【详解】

读取文件时按行加载到 `std::vector<:string>`

直接逐行读取比一次性读入再分割更安全，避免空行、BOM、混合换行符（\r\n vs \n）导致的切分错误。用 std::getline 是最稳妥的方式：

std::ifstream file("input.txt");
std::vector lines;
std::string line;
while (std::getline(file, line)) {
    lines.push_back(line);
}

std::getline 自动剥离换行符，不保留 \r（Windows 下常见残留）
如果文件含 BOM（如 UTF-8 with BOM），需在打开前跳过前 3 字节，否则首行会以 \xef\xbb\xbf 开头
空行会被读作长度为 0 的 std::string，应保留还是过滤，取决于业务逻辑

排序前明确比较逻辑：区分大小写？忽略空白？

默认 std::sort(lines.begin(), lines.end()) 是字典序（ASCII 值升序），但实际需求常更复杂：

忽略首尾空白：先用 std::string::find_first_not_of(" \t") 和 find_last_not_of(" \t") 截取有效子串再比
忽略大小写：用 std::tolower 逐字符比较，或用 std::locale + std::collate（注意平台差异）
数字感知排序（natural sort）：C++ 标准库不内置，需手写比较函数，识别连续数字并按数值比（如 "file10.txt" 排在 "file2.txt" 后）

示例：忽略首尾空格的升序比较：

auto trim_compare = [](const std::string& a, const std::string& b) {
    auto l = a.find_first_not_of(" \t");
    auto r = a.find_last_not_of(" \t");
    std::string sa = (l == std::string::npos) ? "" : a.substr(l, r - l + 1);
l = b.find_first_not_of(" \t");
r = b.find_last_not_of(" \t");
std::string sb = (l == std::string::npos) ? "" : b.substr(l, r - l + 1);

return sa < sb;
};
std::sort(lines.begin(), lines.end(), trim_compare);
写回文件时注意换行符一致性与编码

排序后写入新文件，最容易被忽略的是换行符和编码格式：
立即学习“C++免费学习笔记（深入）”；

							
								
								
									笔尖Ai写作
									AI智能写作，1000+写作模板，轻松原创，拒绝写作焦虑！一款在线Ai写作生成器
								
								下载 
							
						

Windows 默认用 \r\n，Linux/macOS 用 \n；若目标环境固定，建议显式写 \n 或 "\r\n"，别依赖 std::endl（它还触发 flush，影响性能）
若原文件是 UTF-8（无 BOM），写入时确保不意外插入 BOM；若需带 BOM，开头写 "\xef\xbb\xbf"

用二进制模式（std::ios::binary）写可避免某些平台对 \n 的自动转换，但需手动处理换行符
std::ofstream out("sorted.txt");
for (const auto& line : lines) {
    out << line << '\n'; // 显式用 '\n'，不依赖平台
}
大文件不能全量加载？得用外部排序或流式处理
当文件远超内存（如 >500MB），把所有行塞进 std::vector 会 OOM。这时必须换策略：

分块读取 + 归并：按内存上限切分成多个临时排序文件，再用 k 路归并（类似 Unix sort 命令底层）
只存关键字段 + 索引：若每行有唯一主键（如 ID），可只读 ID 和文件偏移，排序后按偏移顺序重读原文件输出
借助系统工具：在支持的环境中调用 std::system("sort input.txt > sorted.txt")，简单可靠，但失去控制权且不可移植

真正需要手写外部排序时，核心是复用 std::priority_queue 做多路归并，而非重造 std::sort。
按行排序本身不难，难的是搞清输入边界、比较语义、输出规范这三处细节——它们几乎决定了结果是否“正确”。

c++中如何获取当前时区的名称_c++11/17处理时区的方法【详解】

c++中如何使用std::high_resolution_clock_c++高精度计时【详解】

如何在c++中集成TensorFlow Lite进行边缘计算？ (移动端AI部署)

c++中如何实现文本文件的关键词高亮显示输出_c++控制台技巧【详解】

c++中如何使用std::wcout输出宽字符中文_c++本地化设置方法【汇总】

c++速学教程(入门到精通)

c++怎么学习？c++怎么入门？c++在哪学？c++怎么学才快？不用担心，这里为大家提供了c++速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

linux windows 编码字节 mac c++ ios macos win stream cos 标准库 String sort bom input ASCII windows macos ios linux unix

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：c++中如何使用std::variant的holds_alternative_c++类型检查技巧【详解】下一篇：c++中如何将double转换为int并四舍五入_c++数值转换技巧【实例】

作者最新文章

composer如何安装Slim框架_composer构建轻量级PHP应用步骤【实战】

2026-01-22 08:06

c++中如何判断字符串是否符合Email格式_c++正则表达式应用【详解】

2026-01-22 08:25

C盘空间越来越少提示存储不足怎么办迁移大型文件并深度清理系统缓存【扩容】

2026-01-22 08:30

oppo云服务官网地址 oppo云服务在线登录页面

2026-01-22 08:35

苹果手机怎么更换App图标_苹果手机自定义桌面图标教程【个性化】

2026-01-22 08:38

tplink路由器后台登录 tplink Web管理界面入口

2026-01-22 08:44

神奇海螺试验场网站地址神奇海螺试验场在线生成地址

2026-01-22 08:45

久久小说网怎么横屏阅读久久小说网屏幕旋转怎么设置【步骤】

2026-01-22 09:00

c++中如何使用explicit关键字_c++禁止隐式转换的用法【汇总】

2026-01-22 09:32

久久小说网官方阅读网久久小说网完本小说排行榜

2026-01-22 09:36

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

338

2023.08.02

sort排序函数用法

sort排序函数的用法：1、对列表进行排序，默认情况下，sort函数按升序排序，因此最终输出的结果是按从小到大的顺序排列的；2、对元组进行排序，默认情况下，sort函数按元素的大小进行排序，因此最终输出的结果是按从小到大的顺序排列的；3、对字典进行排序，由于字典是无序的，因此排序后的结果仍然是原来的字典，使用一个lambda表达式作为key参数的值，用于指定排序的依据。

387

2023.09.04

点击input框没有光标怎么办

点击input框没有光标的解决办法：1、确认输入框焦点；2、清除浏览器缓存；3、更新浏览器；4、使用JavaScript；5、检查硬件设备；6、检查输入框属性；7、调试JavaScript代码；8、检查页面其他元素；9、考虑浏览器兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

183

2023.11.24

常见的编码方式

常见的编码方式有ASCII编码、Unicode编码、UTF-8编码、UTF-16编码、GBK编码等。想了解更多编码方式相关内容，可以阅读本专题下面的文章。

591

2023.10.24

a和A对应的ASCII码数值

a的ascii码是65，a的ascii码是97；ascii码表中，一个字母的大小写数值相差32，一般知道大写字母的ascii码数值，其对应的小写字母的ascii码数值就算出来了，是大写字母的ascii码数值“+32”。想了解更多相关的内容，可阅读本专题下面的相关文章。

2135

2024.10.24

windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口，端口号的范围从0到65535，比如用于浏览网页服务的80端口，用于FTP服务的21端口等等。怎么查看windows端口占用情况呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

644

2023.07.26