Python怎么使用生成器（generator）和yield_生成器与yield关键字深度解析

尼克

发布时间：2025-09-14 12:21:01

845人浏览过

来源于php中文网

原创

生成器通过yield实现惰性求值，按需生成值而不一次性加载所有数据，提升内存效率。调用生成器函数返回迭代器对象，每次next()触发函数执行至yield暂停并返回值，状态得以保留，后续调用继续执行。与普通函数立即返回并销毁状态不同，生成器可多次暂停与恢复，适合处理大规模序列。生成器表达式（如(x*x for x in range(n) if x%2==0)）提供简洁语法，避免显式函数定义，适用于简单过滤或转换场景，兼顾代码清晰与性能优化。

python怎么使用生成器（generator）和yield_生成器与yield关键字深度解析

Python中的生成器（generator）和

yield

关键字是处理序列数据，尤其是大规模或无限序列时的强大工具。简单来说，生成器是一种特殊的迭代器，它允许你按需生成值，而不是一次性在内存中创建所有值。

yield

关键字是定义生成器函数的标志，它不像

return

那样终止函数执行，而是暂停函数，保存其状态，并在下次调用时从上次暂停的地方继续执行。这使得处理大量数据时，内存效率大大提升，也让代码逻辑更加简洁。

解决方案

生成器通过

yield

关键字工作。当一个函数包含

yield

语句时，它就变成了一个生成器函数。调用这个函数并不会立即执行其内部代码，而是返回一个生成器对象（一个迭代器）。当你对这个生成器对象调用

next()

方法（或者在

for

循环中使用它）时，函数体才会开始执行，直到遇到第一个

yield

语句。此时，

yield

后面的值会被“生成”并返回，而函数的状态（包括局部变量和执行位置）会被冻结。下次再调用

next()

时，函数会从上次

yield

暂停的地方继续执行，直到遇到下一个

yield

或函数结束。如果函数执行完毕没有更多的

yield

，就会抛出

StopIteration

异常，标志着迭代的结束。这种“惰性求值”的机制，是我个人认为它最迷人的地方，因为它彻底改变了我们处理数据流的方式。

def simple_generator():
    print("开始生成...")
    yield 1
    print("生成了1，继续...")
    yield 2
    print("生成了2，即将结束...")
    yield 3
    print("生成器函数执行完毕。")

# 创建生成器对象
gen = simple_generator()

# 逐个获取值
print(next(gen)) # 输出：开始生成... 1
print(next(gen)) # 输出：生成了1，继续... 2
print(next(gen)) # 输出：生成了2，即将结束... 3

try:
    print(next(gen))
except StopIteration:
    print("所有值都已生成，迭代结束。")

为什么生成器在处理大数据时如此高效？

生成器之所以在处理大数据时显得格外高效，核心在于它的“惰性求值”特性。它不会一次性将所有数据加载到内存中，而是根据需要，逐个或分批地生成数据。这与列表（list）等数据结构形成了鲜明对比，列表在创建时就需要将所有元素都存储在内存中。想象一下，如果你要处理一个包含数十亿行数据的日志文件，如果尝试将其全部读入一个列表中，你的系统内存很可能瞬间就会耗尽。而使用生成器，你可以一行一行地读取、处理，然后丢弃已处理的行，内存占用始终保持在一个可控的低水平。我曾经在处理一些大型CSV文件时深有体会，普通的文件读取方式常常导致内存溢出，但改用生成器后，问题迎刃而解，而且代码也变得更清晰。

生成器函数与普通函数在使用上有什么关键区别？

生成器函数与普通函数最核心的区别在于它们的返回值和执行流程。普通函数在执行到

return

语句时，会返回一个值并彻底终止函数的执行，其内部的所有局部变量和状态都会被销毁。而生成器函数遇到

yield

语句时，它会“暂停”执行，返回

yield

后面的值，但并不会终止。它的局部变量和执行状态会被保存下来。下次对生成器对象调用

next()

时，函数会从上次

yield

暂停的地方继续执行，直到遇到下一个

yield

或函数结束。

立即学习“Python免费学习笔记（深入）”；

Replit Agent

Replit最新推出的AI编程工具，可以帮助用户从零开始自动构建应用程序。

下载

这意味着，普通函数只执行一次，返回一个结果；而生成器函数可以被多次“恢复”执行，每次返回一个结果，直到所有结果都生成完毕。这种“可暂停、可恢复”的特性，让生成器非常适合用于迭代器模式的实现，尤其是当序列的完整内容无法或不应一次性计算出来时。

如何利用生成器表达式简化代码？

生成器表达式提供了一种简洁、优雅的方式来创建生成器，它的语法与列表推导式非常相似，只是将方括号

[]

替换为圆括号

()

。这种语法糖让生成器的创建变得非常直观，尤其是在需要对现有可迭代对象进行转换或过滤时。它本质上就是创建了一个匿名生成器函数，省去了显式定义函数的步骤。

例如，如果你想处理一个大文件中的数字，并只对其中的偶数进行某种操作，使用生成器表达式可以这样写：

# 假设有一个非常大的数字序列
# large_numbers = range(100000000) # 这是一个生成器，本身就惰性

# 使用生成器表达式处理
even_squares = (x * x for x in range(100000000) if x % 2 == 0)

# 现在 even_squares 是一个生成器对象，不会立即计算所有平方
# 我们可以按需迭代它
for _ in range(5):
    print(next(even_squares))

# 输出：
# 0
# 4
# 16
# 36
# 64

这里

even_squares

并不是一个包含所有偶数平方的列表，而是一个生成器。它只在每次

next()

被调用时，才计算下一个符合条件的偶数的平方。这在代码可读性和内存效率上都达到了很好的平衡。我个人觉得，对于简单的数据转换或过滤场景，生成器表达式比定义一个完整的生成器函数更加“Pythonic”，也更符合快速原型开发的习惯。

Python collections.Counter 是否适合大数据统计？

Python 中变量赋值的本质：引用传递与对象状态分离

Python 如何判断一段代码是否 CPU 密集？

Python 函数对象本身保存了哪些信息？

Python 函数注解是如何被保存的？

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

759

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

639

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

761

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

618

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1265

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

548

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

579

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

709

2023.08.11