0

0

Java自定义字符串哈希:通过包装类与hashCode()重写

碧海醫心

碧海醫心

发布时间:2025-11-15 15:58:13

|

352人浏览过

|

来源于php中文网

原创

Java自定义字符串哈希:通过包装类与hashCode()重写

本文详细介绍了如何在java中为字符串实现自定义哈希函数,以满足特定哈希需求,例如将字符的ascii值求和作为哈希码。通过创建一个字符串包装类并重写其`hashcode()`和`equals()`方法,我们可以在不修改现有哈希表实现的前提下,将自定义哈希逻辑应用于哈希集合或映射中。这种方法提供了一种灵活且符合java规范的解决方案。

在Java中,String类默认的hashCode()实现采用了一种基于31的乘法散列算法,即 s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]。然而,在某些特定场景下,开发者可能希望使用一种更简单或定制化的哈希算法,例如仅将字符串中所有字符的ASCII值累加作为哈希码。直接修改String类的行为是不可能的,因为String是Java核心库中的最终类。为了在哈希表(如HashMap或HashSet)中使用自定义的字符串哈希逻辑,同时避免从头开始实现一个哈希表,我们可以采用创建包装类并重写其哈希相关方法的策略。

解决方案核心:创建字符串包装类

核心思想是创建一个新的类,该类封装一个String实例,并在这个新类中重写hashCode()和equals()方法,以实现我们自定义的哈希和相等性判断逻辑。

1. 创建自定义字符串包装类

首先,定义一个简单的类,例如MyString,它包含一个String类型的字段来存储实际的字符串值。

import java.util.Objects;

public class MyString {
    private final String value; // 封装原始字符串

    public MyString(String value) {
        this.value = value;
    }

    public String getValue() {
        return value;
    }

    // 后续将在此处重写 equals() 和 hashCode()
}

2. 实现自定义hashCode()方法

在MyString类中,我们需要重写hashCode()方法来提供我们期望的自定义哈希算法。例如,如果目标是将所有字符的ASCII值求和作为哈希码,可以这样实现:

立即学习Java免费学习笔记(深入)”;

    @Override
    public int hashCode() {
        // 自定义哈希实现:将所有字符的Unicode码点(ASCII值)求和
        // codePoints() 方法返回一个 IntStream,包含字符串中所有字符的码点
        return value.codePoints().sum();
    }

这里使用了String.codePoints().sum()方法。codePoints()方法返回一个IntStream,其中包含字符串中每个字符的Unicode码点。对于ASCII字符,码点与ASCII值是相同的。sum()方法则将这些码点累加起来,生成一个整数作为哈希码。

3. 重写equals()方法的重要性

当重写hashCode()方法时,必须同时重写equals()方法,以遵守Java中Object类对这两个方法的核心契约。这个契约规定:

存了个图
存了个图

视频图片解析/字幕/剪辑,视频高清保存/图片源图提取

下载
  • 如果两个对象根据equals(Object)方法是相等的,那么它们的hashCode()方法必须产生相同的整数结果。
  • 如果两个对象根据equals(Object)方法是不相等的,那么它们的hashCode()方法可以产生相同或不同的整数结果。然而,为了提高哈希表的性能,不相等的对象最好产生不同的哈希码。

违反此契约会导致哈希表(如HashMap、HashSet)无法正确工作,例如,你可能无法从HashMap中检索到已存入的对象,或者HashSet中出现重复元素。

MyString类的equals()方法应基于其内部封装的String值进行比较:

    @Override
    public boolean equals(Object o) {
        // 引用相等,直接返回true
        if (this == o) return true;
        // 如果是null或者类型不匹配,返回false
        if (o == null || getClass() != o.getClass()) return false;
        // 类型转换
        MyString myString = (MyString) o;
        // 比较封装的字符串值是否相等
        return Objects.equals(value, myString.value);
    }

将上述代码片段整合到MyString类中,完整的MyString类如下:

import java.util.Objects;

public class MyString {
    private final String value;

    public MyString(String value) {
        this.value = value;
    }

    public String getValue() {
        return value;
    }

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        MyString myString = (MyString) o;
        return Objects.equals(value, myString.value);
    }

    @Override
    public int hashCode() {
        // 自定义哈希实现:将所有字符的Unicode码点(ASCII值)求和
        return value.codePoints().sum();
    }
}

使用自定义哈希字符串

现在,你可以使用MyString的实例作为键(key)或元素(element)放入Java的哈希集合或哈希映射中。这些数据结构在内部使用对象的hashCode()和equals()方法来确定元素的存储位置和唯一性。

import java.util.HashMap;
import java.util.HashSet;
import java.util.Map;
import java.util.Set;

public class CustomHashExample {
    public static void main(String[] args) {
        // 使用MyString作为HashMap的键
        Map myMap = new HashMap<>();

        MyString s1 = new MyString("hello");
        MyString s2 = new MyString("world");
        MyString s3 = new MyString("olleh"); // 与"hello"字符相同,但顺序不同,hashCode可能相同

        myMap.put(s1, "Hello Value");
        myMap.put(s2, "World Value");
        myMap.put(s3, "Olleh Value");

        System.out.println("Map content:");
        for (Map.Entry entry : myMap.entrySet()) {
            System.out.println("Key: " + entry.getKey().getValue() + ", HashCode: " + entry.getKey().hashCode() + ", Value: " + entry.getValue());
        }

        // 尝试获取
        MyString s1_lookup = new MyString("hello");
        System.out.println("\nRetrieving 'hello': " + myMap.get(s1_lookup)); // 应该能找到

        MyString s3_lookup = new MyString("olleh");
        System.out.println("Retrieving 'olleh': " + myMap.get(s3_lookup)); // 应该能找到

        // 注意:由于是字符ASCII值求和,"hello"和"olleh"的哈希码是相同的
        // 但是equals方法会判断字符串值是否相同,所以它们在HashMap中是不同的键
        System.out.println("\nHashCode for 'hello': " + s1.hashCode());
        System.out.println("HashCode for 'olleh': " + s3.hashCode());
        System.out.println("Are 'hello' and 'olleh' equal (MyString.equals)? " + s1.equals(s3));
        System.out.println("Are 'hello' and 'hello' equal (MyString.equals)? " + s1.equals(s1_lookup));

        // 使用MyString作为HashSet的元素
        Set mySet = new HashSet<>();
        mySet.add(new MyString("apple"));
        mySet.add(new MyString("banana"));
        mySet.add(new MyString("apple")); // 再次添加"apple",由于equals和hashCode,不会重复添加

        System.out.println("\nSet content:");
        for (MyString ms : mySet) {
            System.out.println("Element: " + ms.getValue() + ", HashCode: " + ms.hashCode());
        }
    }
}

运行上述示例,你会观察到"hello"和"olleh"虽然内部字符串值不同,但由于它们的字符组成相同,通过value.codePoints().sum()计算出的哈希码是相同的。然而,因为equals()方法会比较实际的字符串内容,它们仍然被视为两个不同的键或元素。这证明了equals()和hashCode()协同工作的重要性。

注意事项

  1. equals()与hashCode()契约:再次强调,重写hashCode()时务必同时重写equals(),并确保它们遵循Java规范。这是哈希表正确运行的基础。
  2. 哈希函数的质量:自定义的哈希函数应尽可能将不相等的对象分散到不同的哈希桶中,以减少哈希冲突。一个糟糕的哈希函数(例如总是返回一个常数)会导致所有对象都进入同一个桶,从而将哈希表的平均时间复杂度退化为O(n),失去其性能优势。本教程中的ASCII值求和方法简单易懂,但对于长度较长或字符集复杂的字符串,其哈希冲突的可能性较高,性能可能不如String类默认的哈希函数。
  3. 不可变性:作为哈希表键的对象通常应该是不可变的。如果作为键的对象在放入哈希表后其内部状态(影响hashCode()或equals()的字段)发生改变,那么在后续查找时可能无法找到该对象,或者导致哈希表内部结构混乱。在MyString类中,value字段被声明为final,保证了MyString实例的不可变性。
  4. 性能考量:自定义哈希函数的计算成本也应考虑。过于复杂的计算会抵消哈希表在查找上的优势。

总结

通过创建一个简单的包装类并重写其equals()和hashCode()方法,我们能够灵活地为字符串实现自定义的哈希逻辑,并将其无缝集成到Java标准的哈希集合和哈希映射中。这种方法避免了重新实现整个哈希表的复杂性,同时提供了高度的定制性。在设计自定义哈希函数时,务必牢记equals()与hashCode()的契约,并努力设计一个分布均匀且计算高效的哈希算法,以确保哈希数据结构的性能和正确性。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

826

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

727

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

732

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

396

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

446

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

429

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16904

2023.08.03

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

194

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.2万人学习

C# 教程
C# 教程

共94课时 | 5.9万人学习

Java 教程
Java 教程

共578课时 | 41.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号