==比较值是否相等(由__eq__控制),is比较是否为同一内存对象;小整数和短字符串可能因缓存导致is误判;None必须用is判断;重写__eq__需同步处理__hash__以保证哈希一致性。

Python 中 == 和 is 的本质区别
== 比较的是值是否“相等”,由对象的 __eq__ 方法控制;is 比较的是两个变量是否指向**同一个内存地址**(即是否为同一对象)。这是最常混淆的起点。
常见错误现象:if a == b: 本意是判断逻辑相等,却误用 if a is b:,尤其在比较 None、True、False 以外的值时极易出错。
- 小整数(-5 到 256)和短字符串在 CPython 中会被缓存,所以
100 is 100返回True,但1000 is 1000可能为False(依赖实现,不可依赖) - 自定义类默认继承
object.__eq__,它实际退化为is比较,所以未重写__eq__的实例之间==等价于is - 永远用
is None而不是== None,因为None是单例,且某些对象可能错误地实现__eq__返回True给非None值
自定义类中如何正确实现 __eq__ 和 __hash__
只要重写了 __eq__,就**必须考虑 __hash__ 是否仍适用**。默认情况下,自定义类实例是可哈希的(hash(obj) 有效),但一旦定义了 __eq__ 且没定义 __hash__,Python 会自动将 __hash__ 设为 None,导致该实例无法用作字典键或加入集合。
- 若对象逻辑上“不可变”(如
Point(x, y)),可在__eq__中按字段比较,并显式定义__hash__ = lambda self: hash((self.x, self.y)) - 若对象是可变的(如带状态的
Cache),应保持__hash__为None(即不定义,或设为__hash__ = None),避免哈希表损坏 -
__eq__必须满足自反性、对称性、传递性;返回值必须是布尔类型,不能是其他真值对象(如返回字符串或数字会被隐式转换,但违反约定)
内置类型比较的隐含行为与陷阱
不同内置类型的比较规则并不总是一致,且部分行为在 Python 版本间有变化(如 Py3 废除了跨类型排序)。
立即学习“Python免费学习笔记(深入)”;
-
list和tuple按元素逐个比较,一旦某位置不等即返回结果,不要求长度一致([1,2] 为True) -
dict在 Py3.7+ 中按插入顺序比较键值对,{'a':1, 'b':2} == {'b':2, 'a':1}仍为True(键值对相同),但顺序只影响迭代,不影响相等性 -
float('nan') == float('nan')恒为False,这是 IEEE 754 规定,需用math.isnan()判断 -
bytes和str之间不允许直接==(Py3 报TypeError),不存在隐式编码/解码
深比较:什么时候该用 deepcopy 或第三方库?
Python 标准库没有内置“深比较”函数。== 对容器是递归的(即 [a, b] == [c, d] 会调用 a == c 和 b == d),但这仍是浅层语义——它不处理循环引用,也不跳过特定字段(如私有属性、动态计算属性)。
- 遇到嵌套对象含循环引用(如树节点互相持有父引用),直接
==会触发无限递归并报RecursionError -
unittest.TestCase.assertEqual内部做了循环引用检测和类型适配,适合测试场景,但不建议在生产逻辑中直接依赖 unittest 工具 - 需要可控深比较时,可用
deepdiff库(DeepDiff(a, b)返回差异描述)或手动用json.dumps(sorted_dict, sort_keys=True)做序列化后比对(仅限 JSON 兼容结构)
__eq__,整个 == 结果就可能出人意料。










