0

0

如何在Java中逐行扫描文件A,并对每一行在文件B中进行全文匹配

聖光之護

聖光之護

发布时间:2025-12-30 12:45:32

|

277人浏览过

|

来源于php中文网

原创

如何在Java中逐行扫描文件A,并对每一行在文件B中进行全文匹配

本文讲解如何用java实现:读取文件a的每一行,然后在文件b的全部内容中查找该行是否包含任意一个b中的名字;若匹配成功,则将该行写入结果文件。核心在于避免scanner无法重置的问题,通过循环内重建scanner实现重复读取。

在Java中,Scanner 是单向流式读取器,一旦读到文件末尾(hasNextLine() 返回 false),它无法自动回退到开头——这正是原代码逻辑失效的根本原因。因此,要让“每行A都完整比对整个B”,必须确保每次进入内层循环时,都能从B文件起始位置重新扫描。最直接、清晰且适合初学者的解决方案是:在每次外层循环迭代中,新建一个 Scanner 实例来读取文件B

以下是优化后的完整实现(含资源管理与健壮性改进):

import java.io.*;
import java.util.Scanner;

public class NameMatcher {
    public static void main(String[] args) {
        File fileA = new File("A.txt");
        File fileB = new File("B.txt");
        File outputFile = new File("PersonList.txt");

        try (Scanner scanA = new Scanner(fileA)) {
            // 逐行读取A.txt
            while (scanA.hasNextLine()) {
                String lineFromA = scanA.nextLine().trim();
                if (lineFromA.isEmpty()) continue;

                // 每次都新建Scanner,确保从B文件开头重新扫描
                try (Scanner scanB = new Scanner(fileB)) {
                    boolean matched = false;
                    while (scanB.hasNextLine()) {
                        String nameInB = scanB.nextLine().trim();
                        if (nameInB.isEmpty()) continue;
                        // 判断lineFromA是否包含nameInB(全名精确匹配,不区分大小写)
                        if (lineFromA.toLowerCase().contains(nameInB.toLowerCase())) {
                            matched = true;
                            break; // 找到一个即跳出,避免重复写入同一行
                        }
                    }

                    // 匹配成功则追加写入结果文件
                    if (matched) {
                        try (FileWriter fw = new FileWriter(outputFile, true);
                             BufferedWriter bw = new BufferedWriter(fw);
                             PrintWriter writer = new PrintWriter(bw)) {
                            writer.println(lineFromA); // 使用println确保换行
                        }
                    }
                }
            }
        } catch (FileNotFoundException e) {
            System.err.println("错误:找不到输入文件 — " + e.getMessage());
        } catch (IOException e) {
            System.err.println("I/O错误 — " + e.getMessage());
        }
    }
}

关键改进说明:

  • 使用 try-with-resources 自动关闭所有 Scanner、FileWriter、BufferedWriter 和 PrintWriter,彻底避免资源泄漏(无需手动调用 .close());
  • 对每行做 .trim() 处理,消除首尾空格干扰;跳过空行,提升鲁棒性;
  • 添加 matched 标志位,防止同一行因多次匹配而重复写入;
  • 使用 println() 而非 print(),确保输出文件每条记录独占一行;
  • 错误处理覆盖常见异常(FileNotFoundException、IOException),便于调试。

⚠️ 注意事项:

微信 WeLM
微信 WeLM

WeLM不是一个直接的对话机器人,而是一个补全用户输入信息的生成模型。

下载

立即学习Java免费学习笔记(深入)”;

  • 当前逻辑是「A中某行 包含 B中某名字」(子串匹配)。如需精确单词匹配(例如避免 "Anna" 匹配 "Annabelle"),建议将B中名字存入 Set,再对A中每行按空格/分隔符切分后逐词比对;
  • 若B文件极大(如百万行),频繁重建Scanner并重读磁盘会显著降低性能——此时应改用「预加载B为内存集合」策略(如 Set namesInB = Files.readAllLines(Paths.get("B.txt")).stream().map(String::trim).filter(s -> !s.isEmpty()).collect(Collectors.toSet());),后续仅做O(1)哈希查找;
  • 文件编码未显式指定,默认使用系统平台编码。生产环境建议统一用 StandardCharsets.UTF_8 显式声明(如 new Scanner(fileB, "UTF-8"))。

掌握这种“外层驱动、内层重置”的模式,是处理多文件交叉扫描任务的基础范式。它简洁、可读性强,也完美契合初学者对流程控制的直观理解。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

799

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

722

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

727

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

394

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

445

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

428

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16860

2023.08.03

JavaScript 性能优化与前端调优
JavaScript 性能优化与前端调优

本专题系统讲解 JavaScript 性能优化的核心技术,涵盖页面加载优化、异步编程、内存管理、事件代理、代码分割、懒加载、浏览器缓存机制等。通过多个实际项目示例,帮助开发者掌握 如何通过前端调优提升网站性能,减少加载时间,提高用户体验与页面响应速度。

3

2025.12.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.1万人学习

C# 教程
C# 教程

共94课时 | 5.6万人学习

Java 教程
Java 教程

共578课时 | 39.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号