C++如何实现哈希表 C++哈希表的基本操作与实现

冰火之心

发布时间：2025-06-23 21:06:02

340人浏览过

来源于php中文网

原创

c++++实现哈希表的关键在于选择合适的哈希函数和冲突解决方法。1. 哈希函数应均匀分布键值并高效计算，常用std::hash或自定义函数；2. 冲突解决可采用链地址法（每个位置维护链表）或开放寻址法（探测空位），示例代码使用链地址法；3. 基本操作包括插入、查找和删除，均需依赖哈希函数与冲突策略；4. 扩容通过重新哈希到更大表实现，避免元素拥挤影响效率；5. 避免退化为链表需选好哈希函数、合理扩容并考虑高级策略。综上，设计高效哈希表需综合权衡函数选择、冲突处理及扩容机制。

C++如何实现哈希表 C++哈希表的基本操作与实现

哈希表，简单来说，就是一种快速查找数据的结构。C++里实现哈希表，关键在于选择合适的哈希函数和解决冲突的方法。

解决方案

C++实现哈希表，通常会用到STL里的unordered_map或unordered_set。但如果想更深入理解其原理，可以自己动手实现一个。

定义哈希表结构：

立即学习“C++免费学习笔记（深入）”；

template 
class HashTable {
private:
    struct HashNode {
        K key;
        V value;
        HashNode* next;

        HashNode(const K& key, const V& value) : key(key), value(value), next(nullptr) {}
    };

    std::vector table;
    size_t tableSize;
    size_t currentSize;

    // 哈希函数 (简单示例)
    size_t hashFunction(const K& key) const {
        return std::hash{}(key) % tableSize;
    }

public:
    HashTable(size_t size = 101) : tableSize(size), currentSize(0) {
        table.resize(tableSize, nullptr);
    }

    ~HashTable() {
        for (size_t i = 0; i < tableSize; ++i) {
            HashNode* current = table[i];
            while (current != nullptr) {
                HashNode* next = current->next;
                delete current;
                current = next;
            }
        }
    }

    // 插入
    void insert(const K& key, const V& value) {
        size_t index = hashFunction(key);
        HashNode* newNode = new HashNode(key, value);

        // 链地址法解决冲突
        newNode->next = table[index];
        table[index] = newNode;
        currentSize++;

        // 考虑扩容 (简单示例)
        if (currentSize > tableSize * 0.75) {
            rehash(tableSize * 2);
        }
    }

    // 查找
    V* search(const K& key) {
        size_t index = hashFunction(key);
        HashNode* current = table[index];

        while (current != nullptr) {
            if (current->key == key) {
                return ¤t->value;
            }
            current = current->next;
        }
        return nullptr; // 没找到
    }

    // 删除
    void remove(const K& key) {
        size_t index = hashFunction(key);
        HashNode* current = table[index];
        HashNode* prev = nullptr;

        while (current != nullptr) {
            if (current->key == key) {
                if (prev == nullptr) {
                    table[index] = current->next;
                } else {
                    prev->next = current->next;
                }
                delete current;
                currentSize--;
                return;
            }
            prev = current;
            current = current->next;
        }
    }

private:
    void rehash(size_t newSize) {
        std::vector oldTable = table;
        size_t oldSize = tableSize;

        table.resize(newSize, nullptr);
        tableSize = newSize;
        currentSize = 0;

        for (size_t i = 0; i < oldSize; ++i) {
            HashNode* current = oldTable[i];
            while (current != nullptr) {
                HashNode* next = current->next;
                insert(current->key, current->value);
                delete current;
                current = next;
            }
        }
    }
};

哈希函数： 这是哈希表的核心。一个好的哈希函数应该尽可能地将不同的键均匀地分布到哈希表的各个位置，减少冲突。上面代码中使用了 std::hash，这是C++标准库提供的哈希函数，适用于大多数基本数据类型。对于自定义类型，需要自己重载 std::hash。
冲突解决： 当不同的键被哈希到同一个位置时，就发生了冲突。常见的解决冲突的方法有：

Noya
让线框图变成高保真设计。

下载
- 链地址法（Separate Chaining）： 每个哈希表的位置都维护一个链表，所有哈希到该位置的键值对都存储在这个链表中。上面的代码示例就使用了链地址法。
- 开放寻址法（Open Addressing）： 当发生冲突时，按照某种规则在哈希表中寻找下一个空闲位置。常见的开放寻址法有线性探测、二次探测、双重哈希等。
基本操作： 哈希表的基本操作包括插入（insert）、查找（search）和删除（remove）。这些操作的实现都需要考虑哈希函数和冲突解决策略。
扩容： 当哈希表中的元素越来越多时，冲突的概率也会增加，导致查找效率下降。为了保持哈希表的性能，需要定期进行扩容。扩容时，需要创建一个更大的哈希表，并将原来的元素重新哈希到新的哈希表中。

如何选择合适的哈希函数？

选择哈希函数是个技术活。理想的哈希函数应该满足均匀分布和高效计算这两个条件。对于整数，可以直接使用；对于字符串，可以采用各种字符串哈希算法，比如 MurmurHash、FNV hash 等。关键是根据你的数据特点选择最合适的。记住，没有绝对完美的哈希函数，只有更适合特定场景的。

链地址法和开放寻址法，哪个更好？

这俩各有千秋。链地址法实现简单，冲突处理也比较直接，但缺点是需要额外的空间来存储链表。开放寻址法不需要额外的空间，但冲突处理比较复杂，容易产生堆积现象，影响性能。一般来说，如果数据量不大，且对空间要求比较苛刻，可以选择开放寻址法；如果数据量较大，且可以容忍一定的空间开销，链地址法会是更好的选择。实际应用中，需要根据具体情况进行权衡。

如何避免哈希表退化成链表？

这是个好问题！哈希表最怕的就是所有元素都哈希到同一个位置，那样就退化成链表了，查找效率直线下降。要避免这种情况，首先要选择一个好的哈希函数，保证元素的均匀分布。其次，要合理设置哈希表的初始大小和扩容策略，避免哈希表过于拥挤。此外，还可以采用一些高级的冲突解决策略，比如布谷鸟哈希等，来提高哈希表的性能。总而言之，要综合考虑各种因素，才能设计出一个高效稳定的哈希表。

c++如何用std::regex处理正则表达式 c++正则库入门【实例】

c++的if constexpr是什么编译期分支判断的利器【详解】

C++如何实现一个简单的内存池？（性能优化）

C++如何使用list容器_C++ STL双向链表std::list的特性与操作

C++多态调用流程剖析_C++父类指针指向子类原理