Python 3.7+ 字典保证插入顺序,因“紧凑哈希表”结构和PEP 508规范;视图动态且O(1) in查找;键须不可变;3.9+推荐|合并字典;内存开销为列表的3–5倍。

Python 字典不是“有序容器”的历史遗留问题已经彻底结束——从 Python 3.7 开始,dict 的插入顺序保证是语言规范,不是 CPython 实现细节。
为什么 dict 在 3.7+ 里一定保持插入顺序
这不是巧合,也不是优化副产品。CPython 3.7 将“保持插入顺序”写入了语言文档(PEP 508),意味着所有合规解释器都必须遵守。底层改用“紧凑哈希表”结构:键值对实际存储在单独的数组中,哈希表只存索引。这既提速又天然保序。
- 旧式字典(3.6 及以前)在 CPython 中偶然保序,但 PyPy、Jython 不保证,不能依赖
-
collections.OrderedDict在 3.7+ 仍存在,但仅用于需要move_to_end()或频繁重排序的场景 - 用
dict.fromkeys(keys)构造时,顺序由keys的迭代顺序决定,不是去重后重排
dict.keys()、dict.values()、dict.items() 的视图对象特性
它们不是列表,而是动态视图:原字典变化,视图立刻反映。但不能直接索引或切片,也不能用 .sort()。
- 要转为有序列表:用
list(d.keys())或sorted(d.keys()),注意后者按 key 值排序,不是插入序 - 遍历时想同时拿到索引和键值对?别先转 list 再
enumerate,直接:for i, (k, v) in enumerate(d.items()):
- 判断某个视图是否包含某元素,用
in是 O(1),比转 list 后in快得多
常见误用:把字典当“配置容器”却忽略不可变性约束
字典的键必须是不可变类型,但新手常因嵌套结构踩坑:
立即学习“Python免费学习笔记(深入)”;
-
{[1,2]: "bad"}→TypeError: unhashable type: 'list' -
{{"a": 1}: "also bad"}→ 同样报错,dict 不可哈希 - 正确做法:用
tuple替代list,如{(1,2): "ok"};或用frozenset替代set - JSON 风格配置建议用
types.SimpleNamespace或dataclasses,避免键名拼写错误又无提示
实战:高效合并多个字典并处理键冲突
Python 3.9+ 推荐用 | 操作符,左操作数的键被右操作数覆盖:
d1 = {"a": 1, "b": 2}
d2 = {"b": 3, "c": 4}
merged = d1 | d2 # {"a": 1, "b": 3, "c": 4}
若需自定义冲突逻辑(如相加、取最大值),别用循环更新,改用字典推导式 + collections.defaultdict:
from collections import defaultdict
d1, d2 = {"a": 1, "b": 2}, {"b": 3, "c": 4}
combined = defaultdict(int)
for d in [d1, d2]:
for k, v in d.items():
combined[k] += v # 或 max(combined[k], v)
result = dict(combined)
注意:**d1, **d2 解包方式在 3.5+ 可用,但可读性差、调试困难,且无法干预冲突逻辑。
真正容易被忽略的是字典的内存开销——它比同样大小的列表高 3–5 倍。高频创建小字典(比如循环内)时,考虑缓存复用或改用 array.array + 索引映射。










