FileStats类旨在提供一个简单易用的接口,用于执行基本的文本文件分析。它的核心功能包括:
该类将封装文件路径,并通过其方法提供上述统计功能。
FileStats类包含一个私有字段 filename 用于存储文件路径,以及一个构造器用于初始化该路径。
import java.io.File; import java.io.FileNotFoundException; import java.util.Scanner; public class FileStats { private String filename; /** * 构造器,初始化FileStats对象,指定要分析的文件路径。 * @param f 文件路径字符串 */ public FileStats(String f) { this.filename = f; } // 后续方法将在此处添加 }
getNumLines() 方法负责打开文件并逐行读取,统计总行数。在此方法中,正确使用 Scanner 读取 File 对象是关键。为了确保资源被妥善关闭,我们强烈推荐使用 Java 7 引入的 try-with-resources 语句。
立即学习“Java免费学习笔记(深入)”;
/** * 获取文件的总行数。 * @return 文件的总行数 * @throws FileNotFoundException 如果指定的文件不存在 */ public int getNumLines() throws FileNotFoundException { File fileObj = new File(filename); int numLines = 0; // 使用try-with-resources确保Scanner资源被自动关闭 try (Scanner inputFile = new Scanner(fileObj)) { while (inputFile.hasNextLine()) { inputFile.nextLine(); // 读取一行但不需要其内容 numLines++; } } // Scanner在此处自动关闭 return numLines; }
注意事项:
getNumLinesThatContain(String key) 方法用于统计文件中包含指定 key 的行数。这个方法是原始问题中出现错误的地方,核心问题在于 Scanner 的初始化。
常见错误分析: 在原始代码中,getNumLinesThatContain 方法内部使用了 inputFile = new Scanner(filename);。这是一个常见的错误,因为 Scanner 构造器接收 String 参数时,它会将该字符串本身视为要扫描的数据,而不是将其作为文件路径来打开文件。因此,Scanner 实际上并没有读取文件的内容,而是试图扫描字符串 filename。
正确实现: 为了正确读取文件内容,Scanner 必须接收一个 File 对象或一个 InputStream。
/** * 统计文件中包含指定文本内容的行数(不区分大小写)。 * @param key 要搜索的文本 * @return 包含指定文本的行数 * @throws FileNotFoundException 如果指定的文件不存在 */ public int getNumLinesThatContain(String key) throws FileNotFoundException { File fileObj = new File(filename); int numLines = 0; // 同样使用try-with-resources确保Scanner资源被自动关闭 try (Scanner inputFile = new Scanner(fileObj)) { // 正确:传入File对象 while (inputFile.hasNextLine()) { String line = inputFile.nextLine(); // 将行内容和搜索关键词都转换为大写进行不区分大小写的比较 if (line.toUpperCase().contains(key.toUpperCase())) { numLines++; } } } // Scanner在此处自动关闭 return numLines; }
关键点:
结合上述所有部分,完整的 FileStats 类代码如下:
import java.io.File; import java.io.FileNotFoundException; import java.util.Scanner; public class FileStats { private String filename; /** * 构造器,初始化FileStats对象,指定要分析的文件路径。 * @param f 文件路径字符串 */ public FileStats(String f) { this.filename = f; } /** * 获取文件的总行数。 * @return 文件的总行数 * @throws FileNotFoundException 如果指定的文件不存在 */ public int getNumLines() throws FileNotFoundException { File fileObj = new File(filename); int numLines = 0; try (Scanner inputFile = new Scanner(fileObj)) { while (inputFile.hasNextLine()) { inputFile.nextLine(); numLines++; } } return numLines; } /** * 统计文件中包含指定文本内容的行数(不区分大小写)。 * @param key 要搜索的文本 * @return 包含指定文本的行数 * @throws FileNotFoundException 如果指定的文件不存在 */ public int getNumLinesThatContain(String key) throws FileNotFoundException { File fileObj = new File(filename); int numLines = 0; try (Scanner inputFile = new Scanner(fileObj)) { while (inputFile.hasNextLine()) { String line = inputFile.nextLine(); if (line.toUpperCase().contains(key.toUpperCase())) { numLines++; } } } return numLines; } // 示例用法(可选,用于测试) public static void main(String[] args) { // 创建一个测试文件 String testFileName = "test_file.txt"; try { java.io.FileWriter writer = new java.io.FileWriter(testFileName); writer.write("Hello World!\n"); writer.write("This is a test line.\n"); writer.write("Another line with hello.\n"); writer.write("JAVA programming.\n"); writer.write("hello again.\n"); writer.close(); System.out.println("测试文件 '" + testFileName + "' 已创建。"); } catch (java.io.IOException e) { System.err.println("创建测试文件时发生错误: " + e.getMessage()); return; } FileStats stats = new FileStats(testFileName); try { int totalLines = stats.getNumLines(); System.out.println("文件总行数: " + totalLines); // 预期输出 5 int linesWithHello = stats.getNumLinesThatContain("hello"); System.out.println("包含 'hello' 的行数: " + linesWithHello); // 预期输出 3 (Hello World!, Another line with hello., hello again.) int linesWithJava = stats.getNumLinesThatContain("JAVA"); System.out.println("包含 'JAVA' 的行数: " + linesWithJava); // 预期输出 1 (JAVA programming.) int linesWithNonExistent = stats.getNumLinesThatContain("xyz"); System.out.println("包含 'xyz' 的行数: " + linesWithNonExistent); // 预期输出 0 } catch (FileNotFoundException e) { System.err.println("错误:文件未找到 - " + e.getMessage()); } finally { // 清理测试文件 File testFile = new File(testFileName); if (testFile.exists()) { testFile.delete(); System.out.println("测试文件 '" + testFileName + "' 已删除。"); } } } }
本教程通过构建 FileStats 类,演示了在 Java 中进行文件行数统计和关键词行数统计的方法。核心要点包括:
遵循这些最佳实践将有助于编写出健壮、高效且易于维护的 Java 文件处理代码。
以上就是Java文件内容统计:构建高效的FileStats类的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号