Linux合并文本文件有五种方法:一、cat命令追加合并;二、join命令基于字段关联合并;三、paste命令逐行并列合并;四、awk实现条件化合并;五、sponge命令安全就地合并。

如果您需要将两个文本文件的内容合并为一个文件,Linux 提供了多种命令行工具实现这一目标。以下是几种常用且实用的方法:
一、使用 cat 命令追加合并
cat 命令最常用于连接并显示文件内容,它可直接将多个文件按顺序输出到标准输出或重定向至新文件,适用于无条件拼接场景。
1、在终端中输入 cat file1.txt file2.txt > merged.txt,将 file1.txt 和 file2.txt 的内容按顺序写入 merged.txt。
2、若需保留原文件并追加到已有目标文件,执行 cat file2.txt >> file1.txt,此时 file2.txt 内容将添加至 file1.txt 末尾。
3、如需合并后查看结果,运行 cat merged.txt 验证内容顺序与完整性。
二、使用 join 命令基于字段关联合并
join 命令要求两个文件均按指定字段(默认为第一列)已排序,它通过匹配公共键值进行横向合并,类似数据库的 INNER JOIN 操作。
1、确保 file1.txt 和 file2.txt 均按首列升序排列,可分别执行 sort -k1,1 file1.txt > sorted1.txt 和 sort -k1,1 file2.txt > sorted2.txt。
2、运行 join sorted1.txt sorted2.txt,输出两文件首列值相等的行,每行包含来自 file1.txt 的全部字段与 file2.txt 的除连接字段外的其余字段。
3、若需保留 file1.txt 中未匹配的行,添加 -a 1 参数;若需同时保留双方未匹配行,使用 -a 1 -a 2。
三、使用 paste 命令逐行并列合并
paste 命令以行为单位将多个文件对应行横向拼接,默认用制表符分隔,适合对齐式合并,不要求文件排序或字段匹配。
1、执行 paste file1.txt file2.txt > paired.txt,生成的新文件中每行由 file1.txt 的一行与 file2.txt 的对应行组成,以 Tab 分隔。
2、如需指定其他分隔符(例如逗号),使用 paste -d ',' file1.txt file2.txt。
3、若两文件行数不等,较短文件末尾缺失行位置将留空,可添加 -s 参数改为纵向序列合并模式。
四、使用 awk 实现条件化合并
awk 提供编程级控制能力,支持按行号、字段值、正则匹配等多种逻辑合并文件,适用于复杂规则场景。
1、执行 awk 'FNR==NR {a[NR]=$0; next} {print a[FNR], $0}' file1.txt file2.txt > awk_merged.txt,实现按行号一一配对合并。
2、若需仅当 file2.txt 某列包含特定字符串时才合并该行,运行 awk 'NR==FNR{a[$1]=$0;next} $2 ~ /pattern/{print a[$1], $0}' file1.txt file2.txt,其中 pattern 为待匹配文本。
3、合并过程中跳过空行可在脚本中加入 NF > 0 判断条件。
五、使用 sponge 命令安全地就地合并
sponge 命令来自 moreutils 工具包,可将管道输入暂存至内存或临时文件,再一次性写入目标文件,避免因重定向导致源文件被截断。
1、安装 moreutils:在 Debian/Ubuntu 系统中执行 sudo apt install moreutils;在 CentOS/RHEL 中使用 sudo yum install moreutils。
2、执行 cat file1.txt file2.txt | sponge file1.txt,将合并结果直接写回 file1.txt,而不会因 file1.txt 同时作为输入和输出导致内容丢失。
3、验证操作结果,运行 wc -l file1.txt 检查总行数是否等于两原始文件行数之和。









