Python dict 的哈希实现与碰撞处理

冷炫風刃

发布时间：2026-01-26 19:59:08

578人浏览过

来源于php中文网

原创

Python dict底层用带种子的多项式哈希与伪随机探测（5*i+1+pertrub）实现开放寻址，表长必为2的幂，删除置DELETED标记不缩容，自定义键须保证__hash__与__eq__一致且基于不可变字段。

python dict 的哈希实现与碰撞处理

Python dict 的底层哈希函数怎么算？ Python 的 `dict` 使用开放寻址法（open addressing），不是链地址法。每个键的哈希值由 `hash()` 生成，但真正存入哈希表时会做掩码处理：`index = hash(key) & (table_size - 1)`，所以表大小必须是 2 的幂——这是为了位运算加速，也决定了扩容时机（负载因子超 2/3 就翻倍）。

`hash()` 对不可变类型有定义：`str`、`int`、`tuple`（元素全不可变）等；可变类型如 `list`、`dict` 直接报 `TypeError: unhashable type`

字符串哈希不是简单累加，而是带种子的多项式滚动哈希（受 `HASH_RANDOMIZATION` 影响，启动时随机化，防 DOS 攻击）

同一进程内相同字符串哈希值稳定；但不同 Python 进程或重启后可能不同（除非设 `PYTHONHASHSEED=0`）

碰撞发生时 dict 怎么找下一个空槽？碰撞不靠拉链，而是用探测序列线性试探。Python 3.7+ 使用的是“伪随机探测”（perturb-based probing）：

初始位置：`i = hash(key) & mask`

若冲突，计算扰动值 `perturb = hash(key)`，然后迭代：`i = (5*i + 1 + perturb) & mask`，再更新 `perturb >>= 5`

探测直到遇到空槽（`NULL`）、已删除标记（`DELETED`）或匹配的键

`DELETED` 槽位必须保留，否则后续查找可能提前终止（比如删了中间一个，后面同探测序列的键就找不到了）

微信 WeLM
WeLM不是一个直接的对话机器人，而是一个补全用户输入信息的生成模型。

下载

立即学习“Python免费学习笔记（深入）”；

探测不是纯线性（`i+1, i+2...`），避免聚集效应；但也不是完全随机，保证可重现

为什么 del d[k] 后 len(d) 变小，但内存不一定释放？删除只把对应桶置为 `DELETED`，不立即收缩表。只有当空槽（含 `DELETED`）占比过高、且实际键数远小于当前容量时，才会在下次插入触发 resize。

插入操作可能触发扩容（表满或负载过高），但删除从不触发缩容

手动缩容只能重建：`d = {k: v for k, v in d.items()}`，或用 `copy.copy(d)`（效果相同）

大量增删后，`dict` 可能存在大量 `DELETED` 槽，导致查找变慢（探测路径变长）、内存虚高

自定义类作为 dict 键时最容易踩的坑必须同时正确定义 `hash` 和 `eq`，且满足：相等的对象必须有相同哈希值。

错误写法：`hash` 返回固定值（如 `return 42`）→ 所有实例哈希相同，退化为 O(n) 查找

更隐蔽的错：`hash` 基于可变属性（如 `self.name`），但之后改了该属性 → 哈希值变化，键再也找不到了（Python 不会重新定位）

正确做法：只对真正不可变的字段哈希，且一旦实例化就不能改；或者干脆不实现 `hash`，让实例默认不可哈希（更安全）

哈希表的高效依赖于均匀分布和低碰撞率，而 Python 的实现把探测逻辑、删除标记、扩容策略都封装得很深——你几乎不用碰它，但一旦要 debug 性能抖动或诡异的键丢失，就得意识到这些细节还在底下跑。

如何检测当前 Python 是否运行在 Nuitka 编译的可执行文件中

Python 数据结构优化与性能调优思路

Python 类属性与实例属性的查找顺序

Python 日志系统设计与实践

Python 函数签名设计与可读性原则

相关标签:

python bing 为什么 Python NULL for 封装字符串 int len copy 对象

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python *args 和 **kwargs 的底层原理下一篇：Python set 的去重原理与性能考量

作者最新文章

谷歌浏览器官网下载怎么操作？谷歌浏览器官网下载步骤教程

2026-01-26 15:36

普通发票查询平台有哪些？普通发票查询平台官方渠道说明

2026-01-26 15:36

荷塘雨课堂网页版入口_荷塘雨课堂网页版登录快速指南

2026-01-26 16:02

小红书官网入口官方网址_小红书官方网站网页版登录入口详解

2026-01-26 16:04

iota + const 块嵌套还能玩吗？实验结果告诉你

2026-01-26 16:17

json.dumps() 如何自定义序列化 set / frozenset

2026-01-26 16:28

poki游戏官方入口地址详解_Poki官网免费游戏在线秒玩入口

2026-01-26 16:54

抖币充值链接怎么弄官方_抖音官方抖币充值链接获取方法

2026-01-26 17:05

ios抖币充值比例详解_iOS苹果抖币充值比例及优惠入口

2026-01-26 17:06

1688官网网址是什么官方地址_阿里巴巴1688批发网官方网站网址

2026-01-26 17:06

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

778

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

685

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

769

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

739

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1445

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

571

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

580

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

752

2023.08.11