yield关键字使函数变为生成器,实现暂停执行、按需返回值并保存状态,相比列表更节省内存,适用于处理大数据、惰性计算和无限序列,yield from则简化了子生成器委托,提升代码简洁性与可维护性。

yield
yield
yield
在我看来,
yield
yield
这个生成器对象才是真正的工作者。当你对它调用
next()
for
yield
yield
当生成器对象再次被请求下一个值时(再次调用
next()
yield
return
StopIteration
这种“按需生成”的模式,与传统的“一次性生成所有结果并存储”的模式形成了鲜明对比。它最直接的好处就是极大地节省内存。想象一下,如果你需要处理一个亿万级别的数据序列,把它全部加载到内存中几乎是不可能的。但如果用生成器,我们每次只需要处理一个数据项,内存占用就能保持在一个非常低的水平。
def simple_generator():
print("开始生成...")
yield 1
print("生成了1,继续...")
yield 2
print("生成了2,快结束了...")
yield 3
print("生成完毕。")
# 调用函数,得到的是一个生成器对象
gen = simple_generator()
# 每次调用next(),函数才执行一部分
print(next(gen)) # 输出:开始生成... 1
print(next(gen)) # 输出:生成了1,继续... 2
print(next(gen)) # 输出:生成了2,快结束了... 3
# 再次调用会抛出StopIteration
# print(next(gen)) # 输出:生成了3,快结束了... 生成完毕。 StopIteration你看,这个例子清晰地展示了
yield
next()
这问题问到了点子上,也是很多初学者容易混淆的地方。在我看来,生成器和普通函数最根本的区别在于它们的执行模型和内存管理策略。
普通函数是“一次性”的。当你调用一个普通函数时,它会从头到尾执行完毕,然后返回一个(或零个)结果。函数执行过程中产生的任何局部变量,在函数返回后就都“烟消云散”了。它就像一个短跑运动员,冲刺到底,然后休息。
而生成器函数则更像一个“马拉松运动员”,它会跑一段,停下来喘口气(
yield
yield
至于为什么选择生成器而非列表,核心考量就是效率和资源消耗。
所以,如果你的数据量可控,或者你需要频繁地随机访问列表中的元素,那么列表可能是更好的选择。但如果你的数据量巨大、需要进行流式处理,或者希望实现惰性计算,那么生成器无疑是更明智、更高效的选择。
yield from
yield from
想象一下,你有一个复杂的生成器,它需要从多个不同的“源”生成数据。在
yield from
def sub_generator_a():
yield 'A1'
yield 'A2'
def sub_generator_b():
yield 'B1'
yield 'B2'
def main_generator_old():
for item in sub_generator_a():
yield item
for item in sub_generator_b():
yield item
# 使用旧方法
for x in main_generator_old():
print(x)
# 输出:A1 A2 B1 B2这段代码虽然能工作,但
for item in ... yield item
yield from
使用
yield from
def sub_generator_a():
yield 'A1'
yield 'A2'
def sub_generator_b():
yield 'B1'
yield 'B2'
def main_generator_new():
yield from sub_generator_a() # 委托给sub_generator_a
yield from sub_generator_b() # 委托给sub_generator_b
# 使用新方法
for x in main_generator_new():
print(x)
# 输出:A1 A2 B1 B2这看起来只是简化了代码,但
yield from
send()
throw()
close()
简而言之,
yield from
for item in ... yield item
yield
send()
throw()
生成器在实际开发中简直是无处不在,尤其是在需要处理大量数据或构建高效数据流的场景。我个人在很多项目中都依赖它来优化性能和内存。
处理大型文件: 这是最经典的场景之一。比如,你需要读取一个几十GB的日志文件或CSV文件。如果一次性
readlines()
def read_large_file(filepath):
with open(filepath, 'r', encoding='utf-8') as f:
for line in f:
yield line.strip()
# 逐行处理文件,而不会一次性加载所有内容
for log_entry in read_large_file('my_huge_log.txt'):
if "ERROR" in log_entry:
print(f"发现错误:{log_entry}")数据流处理管道: 当你需要对数据进行一系列的转换、过滤操作时,生成器可以构建一个高效的“数据处理管道”。每个生成器负责一个步骤,将处理后的结果
yield
def filter_even(numbers):
for n in numbers:
if n % 2 == 0:
yield n
def square(numbers):
for n in numbers:
yield n * n
# 构建管道:生成数字 -> 过滤偶数 -> 求平方
nums = range(1, 11)
processed_data = square(filter_even(nums)) # 惰性求值
for res in processed_data:
print(res) # 输出:4 16 36 64 100这种链式调用,每个步骤都是惰性的,只有在真正需要结果时才计算。
实现自定义迭代器: 如果你需要一个自定义的数据结构,或者希望以非传统方式遍历一个对象,生成器提供了一种非常简洁的方式来实现
__iter__
无限序列的生成: 像斐波那契数列、质数生成器等,它们本质上是无限的。生成器是唯一能在不耗尽内存的情况下表示和使用这些序列的方式。
def fibonacci_sequence():
a, b = 0, 1
while True:
yield a
a, b = b, a + b
fib_gen = fibonacci_sequence()
for _ in range(10):
print(next(fib_gen)) # 输出前10个斐波那契数资源管理(配合 contextlib.contextmanager
yield
contextlib.contextmanager
这些场景都体现了生成器在提高代码效率、降低内存消耗和增强代码可读性方面的巨大价值。掌握了
yield
以上就是yield 关键字的作用与生成器工作流程的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号