如何在Java中逐行扫描文件A，并对每一行在文件B中全局匹配后输出结果

碧海醫心

发布时间：2025-12-29 23:22:02

269人浏览过

来源于php中文网

原创

如何在Java中逐行扫描文件A，并对每一行在文件B中全局匹配后输出结果

本文讲解如何用java实现：读取文件a的每一行，然后在文件b的全部内容中查找是否存在匹配项；若找到，则将该行写入输出文件。核心在于避免scanner因流耗尽而无法重复读取文件b，解决方案是每次循环重建scanner。

在Java中处理多文件交叉匹配时，一个常见误区是复用同一个Scanner对象反复读取同一文件——但Scanner基于输入流（如FileInputStream），一旦读到末尾，流即关闭或耗尽，无法自动重置。正如提问者所察觉：当前代码中scanB在第一次外层循环后已无更多行可读，导致后续personA行永远无法被检查。

✅ 正确做法是：每次进入内层循环前，新建一个Scanner实例指向文件B。这样就能确保每次都是从文件开头完整扫描。

以下是优化后的完整示例代码（含资源管理与逻辑修正）：

import java.io.*;
import java.util.Scanner;

public class FileMatcher {
    public static void main(String[] args) {
        File fileA = new File("A.txt");
        File fileB = new File("B.txt");
        File outputFile = new File("PersonList.txt");

        try (Scanner scanA = new Scanner(fileA)) {
            while (scanA.hasNextLine()) {
                String lineFromA = scanA.nextLine().trim(); // 去除首尾空格，提升匹配鲁棒性

                // ✅ 每次都新建 Scanner 读取 B 文件（从头开始）
                try (Scanner scanB = new Scanner(fileB)) {
                    boolean matched = false;
                    while (scanB.hasNextLine()) {
                        String nameInB = scanB.nextLine().trim();
                        // 若 lineFromA 中包含 nameInB（注意：此处为子串匹配；如需精确单词匹配，建议用 split + contains 或正则）
                        if (lineFromA.contains(nameInB) && !nameInB.isEmpty()) {
                            matched = true;
                            break; // 找到即跳出，避免冗余扫描
                        }
                    }

                    // 匹配成功则追加写入结果文件
                    if (matched) {
                        try (FileWriter fw = new FileWriter(outputFile, true);
                             BufferedWriter bw = new BufferedWriter(fw);
                             PrintWriter writer = new PrintWriter(bw)) {
                            writer.println(lineFromA); // 使用 println 保证每行独立
                        }
                    }
                }
            }
        } catch (FileNotFoundException e) {
            System.err.println("文件未找到: " + e.getMessage());
        } catch (IOException e) {
            System.err.println("IO异常: " + e.getMessage());
        }
    }
}

? 关键改进说明：

北极象沉浸式AI翻译

免费的北极象沉浸式AI翻译 - 带您走进沉浸式AI的双语对照体验

下载

立即学习“Java免费学习笔记（深入）”；

使用 try-with-resources 自动关闭所有Scanner、FileWriter、BufferedWriter和PrintWriter，彻底规避资源泄漏风险（原答案中的手动close()易遗漏且顺序敏感）；
内层Scanner scanB在每次外层循环中新建，确保始终从B.txt第一行开始扫描；
添加trim()防止因空格导致匹配失败；
使用break提前退出内层循环，提升效率；
writer.println()替代writer.print()，确保每条匹配记录独占一行，输出格式清晰。

⚠️ 注意事项：

当前逻辑是子字符串匹配（例如 "Alice Smith" 包含 "Alice" 即命中）。如需全词匹配（如仅当"Alice"作为独立单词出现才匹配），应改用split("\\s+")分割后遍历，或使用正则\\bAlice\\b；
若B.txt极大（如超百万行），频繁打开文件可能影响性能，此时建议一次性读入内存（如Set存储所有姓名），再做O(1)查找——但这属于进阶优化，初学者优先掌握健壮、可读、安全的流式处理方式；
务必确保文件路径正确，或使用绝对路径调试；编码问题（如中文乱码）可通过new Scanner(fileB, "UTF-8")显式指定。

掌握这种“外层驱动、内层重置”的模式，是处理文件交叉校验、日志筛选、黑白名单匹配等场景的基础能力。坚持从规范资源管理和清晰逻辑结构起步，你已走在扎实的编程之路上。

在Java中switch支持哪些数据类型_switch在Java中的演进说明

Java里AtomicInteger适合什么场景_Java无锁并发说明

在Java里catch多个异常的正确方式_多异常捕获语法解析

在Java里AtomicInteger如何保证原子性_Java原子类CAS机制解析

如何用Java编写猜数字小游戏_Java条件判断与循环实战