
字符串压缩是一种常见的数据处理技术,旨在通过缩短字符串的长度来节省存储空间或提高传输效率。其中一种常见的压缩方式是“游程编码”(run-length encoding, rle),它通过将连续重复的字符替换为该字符及其出现的次数来工作。例如,字符串aaabbc可以被压缩为a3b2c或a3b2c1(如果计数为1则省略)。本教程的目标是将abbbccccc压缩为ab3c4。
实现字符串压缩的基本思路通常涉及遍历字符串,并维护当前字符及其连续出现的次数。当遇到一个与当前字符不同的字符时,或者遍历到字符串末尾时,就将前一个字符及其计数添加到结果字符串中,然后重置计数器和当前字符。
在Java中,由于String对象的不可变性,频繁地使用+运算符进行字符串拼接会导致创建大量的中间String对象,从而影响性能。因此,推荐使用StringBuilder类来高效地构建结果字符串。
在实现字符串压缩时,一个常见的陷阱是未能正确处理字符串末尾的连续字符。原始代码的逻辑如下:
// 原始代码片段(简化)
for (int i = 0; i <= len ; i++) {
    if(i != len) { // 确保不是最后一个字符
        if(str.charAt(i) == str.charAt(i+1)) {
            count++;
            continue;
        }
        // 当字符不同时,或count == 1时,将字符和计数添加到newString
        if(count == 1) {
            newString = newString+str.charAt(i);
        } else {
            newString = newString+str.charAt(i)+count;
        }
        // 重置count
        count = 1;
    }
}
return newString; // 在循环结束后直接返回这个代码片段的问题在于,它将字符及其计数添加到结果字符串的条件是str.charAt(i) != str.charAt(i+1)(即当前字符与下一个字符不同),或者count == 1。当循环到达字符串的最后一个字符组时(例如"abbbccccc"中的"ccccc"),在最后一个c处,i已经等于len,i+1会越界,或者即使不越界,循环的内部逻辑也无法在字符组的末尾(即最后一个c之后)触发将c和4添加到newString的操作。当循环结束时,"ccccc"这个组的字符和计数(c和4)仍然停留在count变量中,而没有被添加到newString,导致最终输出缺失。
立即学习“Java免费学习笔记(深入)”;
简而言之,循环内部的逻辑依赖于“下一个字符”来判断是否需要输出当前字符组。当没有“下一个字符”时(即遍历到字符串末尾),这个输出条件就无法满足。
为了解决上述问题,我们需要确保在循环结束后,如果还有未处理的字符组(即count大于0),也要将其添加到结果字符串中。更优雅的解决方案是将字符组的判断和输出逻辑统一在循环内部,确保无论是字符变化还是字符串结束,都能正确处理当前字符组。
以下是优化后的Java字符串压缩代码示例:
import java.lang.StringBuilder;
public class StringCompressor {
    /**
     * 压缩给定字符串,将连续重复的字符替换为字符和其出现次数。
     * 例如:"abbbccccc" 压缩为 "ab3c4"。
     * 如果字符串为空或null,则返回空字符串。
     * 如果字符只出现一次,则不添加数字1。
     *
     * @param str 待压缩的字符串。
     * @return 压缩后的字符串。
     */
    public static String getCompressedString(String str) {
        // 1. 处理边界条件:空字符串或null
        if (str == null || str.isEmpty()) {
            return "";
        }
        StringBuilder compressedString = new StringBuilder();
        int count = 1; // 记录当前字符的连续出现次数
        int n = str.length(); // 字符串长度
        // 2. 遍历字符串
        for (int i = 0; i < n; i++) {
            // 3. 检查当前字符是否与下一个字符相同
            //    确保 i + 1 不会越界
            if (i + 1 < n && str.charAt(i) == str.charAt(i + 1)) {
                count++; // 如果相同,则增加计数
            } else {
                // 4. 字符不同,或者已经到达字符串末尾
                //    将当前字符添加到结果中
                compressedString.append(str.charAt(i));
                //    如果计数大于1,则将计数添加到结果中
                if (count > 1) {
                    compressedString.append(count);
                }
                // 5. 重置计数器为1,为下一个字符组做准备
                count = 1;
            }
        }
        // 6. 返回最终压缩后的字符串
        return compressedString.toString();
    }
    public static void main(String[] args) {
        // 测试用例
        System.out.println("Original: \"abbbccccc\" -> Compressed: \"" + getCompressedString("abbbccccc") + "\""); // 预期: ab3c4
        System.out.println("Original: \"aaaaa\" -> Compressed: \"" + getCompressedString("aaaaa") + "\"");       // 预期: a5
        System.out.println("Original: \"abc\" -> Compressed: \"" + getCompressedString("abc") + "\"");           // 预期: abc
        System.out.println("Original: \"a\" -> Compressed: \"" + getCompressedString("a") + "\"");               // 预期: a
        System.out.println("Original: \"\" -> Compressed: \"" + getCompressedString("") + "\"");                 // 预期: ""
        System.out.println("Original: \"aaabbc\" -> Compressed: \"" + getCompressedString("aaabbc") + "\"");     // 预期: a3b2c
        System.out.println("Original: \"abccba\" -> Compressed: \"" + getCompressedString("abccba") + "\"");     // 预期: abc2ba
    }
}字符串压缩是一个经典的算法问题,它要求我们不仅要理解核心的遍历和计数逻辑,更要细致地处理各种边界条件,特别是字符串末尾字符组的处理。通过本教程,我们深入分析了原始代码中末尾字符计数遗漏的问题,并提供了一个健壮、高效且易于理解的Java解决方案。掌握这种细致入微的编程思维,对于开发高质量的软件至关重要。
以上就是Java字符串压缩实战:优化重复字符计数与末尾处理的详细内容,更多请关注php中文网其它相关文章!
                        
                        每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
                Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号