Python运行时环境的核心是内存管理与对象模型协同工作,一切皆对象,含类型、引用计数和值三部分;引用计数主导自动回收,循环引用需gc模块辅助;小整数和短字符串被池化复用;id()、is、==分别标识地址、同一性与逻辑相等。

Python运行时环境的核心是内存管理与对象模型的协同工作——代码执行时,所有变量、函数、类都不是直接操作内存地址,而是通过对象引用和引用计数机制间接管理。
对象在内存中的存在形式
Python中一切皆对象,每个对象在内存中包含三部分:类型信息(type)、引用计数(refcount)、实际值(value)。例如执行 x = 123,解释器会创建一个整型对象,其类型为 int,引用计数初始为1,值存储在对象数据区。该对象被分配在堆内存中,而变量 x 本身只是栈上一个指向该对象的指针(即引用)。
引用计数与内存回收机制
Python主要依赖引用计数实现自动内存管理。每当一个对象被赋值、作为参数传入函数、加入容器等,其引用计数加1;当变量重新赋值、离开作用域或显式删除(del x),计数减1。一旦计数归零,对象立即被释放。
- 可通过 sys.getrefcount(obj) 查看当前引用数(注意:调用它本身会使计数临时+1)
- 循环引用无法靠引用计数解决(如两个列表互相包含),需依赖垃圾收集器(gc 模块)周期性扫描清理
- 使用 weakref 模块可创建弱引用,不增加引用计数,适合缓存、观察者等场景
小整数与字符串的内存优化
为提升性能,CPython对常用小整数(-5 到 256)和短字符串做了对象池(interning)优化。这些对象在解释器启动时预先创建并复用:
立即学习“Python免费学习笔记(深入)”;
- a = 100; b = 100 → a is b 返回 True(同一对象)
- s1 = "hello"; s2 = "hello" → 通常也共享对象(但仅限于符合标识符规则的字符串,且在编译期确定)
- 手动触发字符串驻留可用 sys.intern(s),适用于大量重复字符串场景(如解析日志)
理解 id()、is 和 == 的区别
id() 返回对象在内存中的唯一标识(CPython中近似为地址);is 判断两个变量是否指向同一对象(即 id(a) == id(b));== 调用对象的 __eq__ 方法,判断逻辑相等性。
- [] == [] 为 True,但 [] is [] 为 False(每次创建新列表对象)
- 对不可变对象(如小整数、短字符串),相同值常对应同一对象,因此 is 偶尔成立,但不应依赖此行为做逻辑判断
- 比较是否为 None 应始终用 is None,而非 == None










