Python代码执行优化需主动识别并消除冗余计算:①循环内重复调用纯函数;②多次计算相同表达式;③对象属性/方法重复访问;④条件判断中重复求值。

Python代码执行优化的关键之一,是主动识别并消除冗余计算。很多性能瓶颈并非来自算法复杂度,而是重复执行相同逻辑、反复计算不变表达式、或在循环中做本可在外部完成的运算。
识别常见冗余计算场景
以下几类代码极易引入隐性冗余:
-
循环内重复调用纯函数:如
len(my_list)、math.sqrt(4)、os.path.exists()(路径不变时)等,在循环中反复调用却返回相同结果; -
多次计算相同表达式:例如
result = (a + b) * (a + b) + (a + b)中,a + b被算三次; -
对象属性/方法重复访问:如
for item in obj.items: print(item.name); process(item.name); save(item.name),连续三次取item.name; -
条件判断中重复求值:如
if expensive_func(x) > 0 and expensive_func(x) ,函数被调用两次。
用变量缓存代替重复计算
最直接有效的优化方式,是把不变结果提前计算并赋给局部变量。Python局部变量访问极快,且能提升可读性。
✅ 优化前:
立即学习“Python免费学习笔记(深入)”;
for i in range(len(data)):
if data[i] > max_val and data[i] < min_val * 2:
# ...✅ 优化后:
data_len = len(data)
min_val_times_2 = min_val * 2
for i in range(data_len):
if data[i] > max_val and data[i] < min_val_times_2:
# ...同理,对循环中稳定不变的对象属性、模块常量、配置值,都建议提前提取。
善用 functools.lru_cache 缓存函数结果
当函数具备纯函数特性(相同输入恒得相同输出,无副作用),且调用开销大、参数范围有限时,可用缓存避免重复执行。
✅ 示例(递归斐波那契):
from functools import lru_cache@lru_cache(maxsize=128) def fib(n): return n if n < 2 else fib(n-1) + fib(n-2)
⚠️ 注意:lru_cache 不适用于含可变参数(如 *args 或 **kwargs 未规范哈希)、或返回值随外部状态变化的函数。必要时可用 cache(Python 3.9+,无大小限制)或自定义字典缓存。
用生成器和惰性求值减少预计算
不是所有“冗余”都指重复,也包括过早/过度计算。比如一次性构建完整列表再过滤,不如用生成器按需产出:
✅ 冗余预计算:
all_squares = [x**2 for x in range(1000000)] filtered = [s for s in all_squares if s % 3 == 0]
✅ 惰性替代:
def square_gen():
for x in range(1000000):
yield x ** 2
filtered = (s for s in square_gen() if s % 3 == 0)
内存占用大幅下降,且若只需前几个结果(如 next(filtered)),后续计算根本不会发生。
优化冗余计算不依赖黑科技,重在养成“这个值会不会变?这次算完下回还要再算吗?”的条件反射。每次重构前花30秒扫一眼循环体和条件分支,往往就能挖出明显提速点。










