Python 的 set 是无序、不重复、可变的哈希表实现数据类型,支持 O(1) 查找/插入/删除;适用于去重(如 set([1,2,2,3])→{1,2,3})和集合运算(|、&、-、^),元素须可哈希。

Python 的 set 是一种无序、不重复、可变的内置数据类型,特别适合做去重和集合运算。它底层基于哈希表实现,查找、插入、删除平均时间复杂度都是 O(1),效率很高。
快速去重:一行搞定重复元素
列表、元组、字符串等可迭代对象转为 set,自动剔除重复项。注意:原顺序不保留,因为 set 本身无序。
例如:
-
nums = [1, 2, 2, 3, 4, 4, 5]→set(nums)得到{1, 2, 3, 4, 5} -
text = "hello"→set(text)得到{'h', 'e', 'l', 'o'}('l' 只出现一次) - 若需保持首次出现顺序,可用
dict.fromkeys():list(dict.fromkeys(nums))
基础集合运算:交、并、差、对称差
set 支持数学意义上的集合操作,有方法形式(如 .union())和运算符形式(如 |),推荐用运算符更简洁直观。
立即学习“Python免费学习笔记(深入)”;
-
并集(Union):
A | B或A.union(B)—— 所有在 A 或 B 中的元素 -
交集(Intersection):
A & B或A.intersection(B)—— 同时在 A 和 B 中的元素 -
差集(Difference):
A - B或A.difference(B)—— 在 A 中但不在 B 中的元素 -
对称差(Symmetric Difference):
A ^ B或A.symmetric_difference(B)—— 在 A 或 B 中,但不同时在两者中的元素
实用技巧:判断关系与批量操作
除了四则运算,set 还提供子集、超集、不相交等逻辑判断,以及更新类方法(直接修改原集合)。
- 判断子集:
A.issubset(B)或A ;超集用A.issuperset(B)或A >= B - 判断是否不相交:
A.isdisjoint(B)(返回 True 表示无公共元素) - 就地更新(不新建集合):
A.update(B)相当于A |= B;A.intersection_update(B)相当于A &= B - 添加/删除单个元素:
A.add(x)、A.remove(x)(不存在时报错)或A.discard(x)(安全删除)
注意事项:不可变性与元素限制
set 要求所有元素必须是“可哈希的”(hashable),即不可变类型。常见合法元素包括 int、float、str、tuple(且 tuple 内部也得全可哈希);列表、字典、其他 set 不允许作为元素。
- 错误示例:
{[1,2], 3}报TypeError;{{'a':1}, 2}同样不行 - 正确示例:
{(1,2), 'hello', 3.14}是合法的 - 如果需要存储可变对象,可考虑用
frozenset(不可变 set),它可作为 dict 的 key 或其他 set 的元素










