
本文讲解如何用java实现:读取文件a的每一行,然后在文件b的全部内容中查找是否存在匹配项;若找到,则将该行写入输出文件。核心在于避免scanner因流耗尽而无法重复读取文件b,解决方案是每次循环重建scanner。
在Java中处理多文件交叉匹配时,一个常见误区是复用同一个Scanner对象反复读取同一文件——但Scanner基于输入流(如FileInputStream),一旦读到末尾,流即关闭或耗尽,无法自动重置。正如提问者所察觉:当前代码中scanB在第一次外层循环后已无更多行可读,导致后续personA行永远无法被检查。
✅ 正确做法是:每次进入内层循环前,新建一个Scanner实例指向文件B。这样就能确保每次都是从文件开头完整扫描。
以下是优化后的完整示例代码(含资源管理与逻辑修正):
import java.io.*;
import java.util.Scanner;
public class FileMatcher {
public static void main(String[] args) {
File fileA = new File("A.txt");
File fileB = new File("B.txt");
File outputFile = new File("PersonList.txt");
try (Scanner scanA = new Scanner(fileA)) {
while (scanA.hasNextLine()) {
String lineFromA = scanA.nextLine().trim(); // 去除首尾空格,提升匹配鲁棒性
// ✅ 每次都新建 Scanner 读取 B 文件(从头开始)
try (Scanner scanB = new Scanner(fileB)) {
boolean matched = false;
while (scanB.hasNextLine()) {
String nameInB = scanB.nextLine().trim();
// 若 lineFromA 中包含 nameInB(注意:此处为子串匹配;如需精确单词匹配,建议用 split + contains 或正则)
if (lineFromA.contains(nameInB) && !nameInB.isEmpty()) {
matched = true;
break; // 找到即跳出,避免冗余扫描
}
}
// 匹配成功则追加写入结果文件
if (matched) {
try (FileWriter fw = new FileWriter(outputFile, true);
BufferedWriter bw = new BufferedWriter(fw);
PrintWriter writer = new PrintWriter(bw)) {
writer.println(lineFromA); // 使用 println 保证每行独立
}
}
}
}
} catch (FileNotFoundException e) {
System.err.println("文件未找到: " + e.getMessage());
} catch (IOException e) {
System.err.println("IO异常: " + e.getMessage());
}
}
}? 关键改进说明:
立即学习“Java免费学习笔记(深入)”;
- 使用 try-with-resources 自动关闭所有Scanner、FileWriter、BufferedWriter和PrintWriter,彻底规避资源泄漏风险(原答案中的手动close()易遗漏且顺序敏感);
- 内层Scanner scanB在每次外层循环中新建,确保始终从B.txt第一行开始扫描;
- 添加trim()防止因空格导致匹配失败;
- 使用break提前退出内层循环,提升效率;
- writer.println()替代writer.print(),确保每条匹配记录独占一行,输出格式清晰。
⚠️ 注意事项:
- 当前逻辑是子字符串匹配(例如 "Alice Smith" 包含 "Alice" 即命中)。如需全词匹配(如仅当"Alice"作为独立单词出现才匹配),应改用split("\\s+")分割后遍历,或使用正则\\bAlice\\b;
- 若B.txt极大(如超百万行),频繁打开文件可能影响性能,此时建议一次性读入内存(如Set
存储所有姓名),再做O(1)查找——但这属于进阶优化,初学者优先掌握健壮、可读、安全的流式处理方式; - 务必确保文件路径正确,或使用绝对路径调试;编码问题(如中文乱码)可通过new Scanner(fileB, "UTF-8")显式指定。
掌握这种“外层驱动、内层重置”的模式,是处理文件交叉校验、日志筛选、黑白名单匹配等场景的基础能力。坚持从规范资源管理和清晰逻辑结构起步,你已走在扎实的编程之路上。










