Python程序先由解释器将源代码经词法语法分析生成平台无关字节码(.pyc),再由PVM逐条解释执行;模块按需导入并立即执行顶层代码;对象通过引用计数与gc协同管理内存。

Python程序运行时,先由解释器把源代码逐行转换成字节码,再由Python虚拟机(PVM)执行字节码。它不直接编译成机器码,所以跨平台性好,但执行速度通常比C、Rust等编译型语言慢。
代码怎么变成可执行的?
你写的 .py 文件不是直接被CPU运行的。Python解释器(如CPython)会先做两件事:
-
词法与语法分析:把文本拆成token(比如
print、(、"hello"),再检查是否符合语法规则; - 生成字节码:存成 .pyc 文件(在 __pycache__ 目录下),这是平台无关的中间指令,类似汇编但更抽象。
字节码谁来执行?
CPython内置一个虚拟机(PVM),它读取字节码,一条条模拟执行——比如遇到 LOAD_NAME 就去查变量名,遇到 BINARY_ADD 就调用对应的加法逻辑。这个过程是解释执行,不是一次性编译完再跑。
注意:JIT(如PyPy)会动态把频繁执行的字节码编译成机器码提速,但标准CPython没有JIT。
立即学习“Python免费学习笔记(深入)”;
模块导入和执行顺序
Python按需加载模块。当你写 import requests,解释器会:
- 在 sys.path 列表中查找 requests 目录;
- 找到后,执行其 __init__.py(如果有)或主模块文件;
- 执行过程中定义的函数、类、变量才真正进入内存。
顶层代码(不在函数/类里的语句)会在导入时立即运行——这也是为什么常看到 if __name__ == "__main__": 来控制脚本直接运行时的行为。
对象和内存怎么管理?
Python一切皆对象。每个对象包含类型信息、引用计数和值。CPython主要靠引用计数自动回收内存:当某个对象引用数降为0,立刻释放。对循环引用(比如两个对象互相持有对方),还配合一个垃圾回收器(gc模块)定期扫描清理。
变量名只是指向对象的标签,赋值 a = b 是让 a 指向和 b 同一个对象,不是复制内容。











