0

0

如何在Java中逐行扫描文件A,并对每一行在文件B中全局匹配后输出结果

碧海醫心

碧海醫心

发布时间:2025-12-29 23:22:02

|

269人浏览过

|

来源于php中文网

原创

如何在Java中逐行扫描文件A,并对每一行在文件B中全局匹配后输出结果

本文讲解如何用java实现:读取文件a的每一行,然后在文件b的全部内容中查找是否存在匹配项;若找到,则将该行写入输出文件。核心在于避免scanner因流耗尽而无法重复读取文件b,解决方案是每次循环重建scanner。

在Java中处理多文件交叉匹配时,一个常见误区是复用同一个Scanner对象反复读取同一文件——但Scanner基于输入流(如FileInputStream),一旦读到末尾,流即关闭或耗尽,无法自动重置。正如提问者所察觉:当前代码中scanB在第一次外层循环后已无更多行可读,导致后续personA行永远无法被检查。

✅ 正确做法是:每次进入内层循环前,新建一个Scanner实例指向文件B。这样就能确保每次都是从文件开头完整扫描。

以下是优化后的完整示例代码(含资源管理与逻辑修正):

import java.io.*;
import java.util.Scanner;

public class FileMatcher {
    public static void main(String[] args) {
        File fileA = new File("A.txt");
        File fileB = new File("B.txt");
        File outputFile = new File("PersonList.txt");

        try (Scanner scanA = new Scanner(fileA)) {
            while (scanA.hasNextLine()) {
                String lineFromA = scanA.nextLine().trim(); // 去除首尾空格,提升匹配鲁棒性

                // ✅ 每次都新建 Scanner 读取 B 文件(从头开始)
                try (Scanner scanB = new Scanner(fileB)) {
                    boolean matched = false;
                    while (scanB.hasNextLine()) {
                        String nameInB = scanB.nextLine().trim();
                        // 若 lineFromA 中包含 nameInB(注意:此处为子串匹配;如需精确单词匹配,建议用 split + contains 或正则)
                        if (lineFromA.contains(nameInB) && !nameInB.isEmpty()) {
                            matched = true;
                            break; // 找到即跳出,避免冗余扫描
                        }
                    }

                    // 匹配成功则追加写入结果文件
                    if (matched) {
                        try (FileWriter fw = new FileWriter(outputFile, true);
                             BufferedWriter bw = new BufferedWriter(fw);
                             PrintWriter writer = new PrintWriter(bw)) {
                            writer.println(lineFromA); // 使用 println 保证每行独立
                        }
                    }
                }
            }
        } catch (FileNotFoundException e) {
            System.err.println("文件未找到: " + e.getMessage());
        } catch (IOException e) {
            System.err.println("IO异常: " + e.getMessage());
        }
    }
}

? 关键改进说明:

北极象沉浸式AI翻译
北极象沉浸式AI翻译

免费的北极象沉浸式AI翻译 - 带您走进沉浸式AI的双语对照体验

下载

立即学习Java免费学习笔记(深入)”;

  • 使用 try-with-resources 自动关闭所有Scanner、FileWriter、BufferedWriter和PrintWriter,彻底规避资源泄漏风险(原答案中的手动close()易遗漏且顺序敏感);
  • 内层Scanner scanB在每次外层循环中新建,确保始终从B.txt第一行开始扫描;
  • 添加trim()防止因空格导致匹配失败;
  • 使用break提前退出内层循环,提升效率;
  • writer.println()替代writer.print(),确保每条匹配记录独占一行,输出格式清晰。

⚠️ 注意事项:

  • 当前逻辑是子字符串匹配(例如 "Alice Smith" 包含 "Alice" 即命中)。如需全词匹配(如仅当"Alice"作为独立单词出现才匹配),应改用split("\\s+")分割后遍历,或使用正则\\bAlice\\b;
  • 若B.txt极大(如超百万行),频繁打开文件可能影响性能,此时建议一次性读入内存(如Set存储所有姓名),再做O(1)查找——但这属于进阶优化,初学者优先掌握健壮、可读、安全的流式处理方式;
  • 务必确保文件路径正确,或使用绝对路径调试;编码问题(如中文乱码)可通过new Scanner(fileB, "UTF-8")显式指定。

掌握这种“外层驱动、内层重置”的模式,是处理文件交叉校验、日志筛选、黑白名单匹配等场景的基础能力。坚持从规范资源管理和清晰逻辑结构起步,你已走在扎实的编程之路上。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

779

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

722

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

727

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

394

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

443

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

428

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16840

2023.08.03

俄罗斯搜索引擎Yandex最新官方入口网址
俄罗斯搜索引擎Yandex最新官方入口网址

Yandex官方入口网址是https://yandex.com;用户可通过网页端直连或移动端浏览器直接访问,无需登录即可使用搜索、图片、新闻、地图等全部基础功能,并支持多语种检索与静态资源精准筛选。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1

2025.12.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.1万人学习

C# 教程
C# 教程

共94课时 | 5.5万人学习

Java 教程
Java 教程

共578课时 | 39.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号