Python列表、字典、集合的底层机制决定其性能与安全性:列表为动态数组,索引O(1)但中间增删O(n);字典基于哈希表,键须可哈希,查找平均O(1);集合是无序去重结构,成员检测O(1),空集合须用set()。

Python 的列表、字典、集合不是“会用就行”的工具,它们的底层行为、时间复杂度、可变性差异,直接决定代码是否健壮、高效、不易出错。理解它们不是背语法,而是看清“什么时候该用谁”“为什么这样写会慢或报错”。
列表:有序、可变、允许重复,但索引访问快,中间插入删除慢
列表底层是动态数组,内存连续,所以按索引取值(lst[5])是 O(1),但往开头或中间 insert() 或 pop(0) 是 O(n)——因为后面所有元素都要平移。
- 避免在循环中对列表做
remove()或append()同时遍历,容易跳过元素或无限循环;推荐用列表推导式过滤:[x for x in lst if x > 0] -
list.append()均摊 O(1),但list.insert(0, x)每次都挪动全部元素,大数据量时明显卡顿 - 复制列表别用
new = old(只是引用),要用new = old.copy()或new = old[:]或new = list(old)
字典:键必须可哈希,查找/插入平均 O(1),但无序(3.7+保持插入顺序是实现细节,非语言保证)
字典靠哈希表实现。键必须是不可变类型(如 str、int、tuple),因为哈希值需稳定;list、dict、set 不可作键,会报 TypeError: unhashable type。
- 判断键是否存在,用
if key in d:,不要用try/except KeyError(除非你本就要取值并处理异常) - 安全取值优先用
d.get(key, default),比d[key]更健壮;批量设默认值可用d.setdefault(key, default) - 遍历时想同时得键和值,直接用
for k, v in d.items():,别先取keys()再索引——后者多一次哈希查找
集合:去重神器,成员检测极快,但不记录顺序、不支持索引
集合本质是精简版字典(只存键,值为占位符),因此成员判断 x in s 平均 O(1),远快于 x in list 的 O(n)。适合查重、交并差运算、快速过滤。
立即学习“Python免费学习笔记(深入)”;
- 创建空集合必须用
set(),{}是空字典——这是高频错误 - 去重保留原顺序?不能直接用
set(lst)(会乱序),改用dict.fromkeys(lst).keys()或list(dict.fromkeys(lst)) - 集合运算符更直观:
s1 & s2(交集)、s1 | s2(并集)、s1 - s2(差集),比调用方法s1.intersection(s2)更简洁
三者嵌套与深浅拷贝:可变对象嵌套时,copy() 只复制一层
列表里放字典、字典里嵌套集合……这类结构很常见。此时 .copy() 或切片 [:] 只是浅拷贝:外层新对象,内层仍共用引用。修改内层字典,原列表里的也会变。
- 需要彻底隔离,用
import copy; deepcopy(obj) - 更轻量的替代:用不可变结构约束自己,比如用
tuple替代list、用frozenset替代set,天然避免意外修改 - 函数传参也是浅拷贝逻辑——传列表进去,函数里
append会影响外部;如不想被改,函数开头就data = data.copy()
不复杂但容易忽略。真正吃透这三者,不是为了炫技,而是写出来的代码少 debug、少重构、上线更稳。










