0

0

yield 关键字的作用与生成器工作流程

幻影之瞳

幻影之瞳

发布时间:2025-09-03 18:31:01

|

271人浏览过

|

来源于php中文网

原创

yield关键字使函数变为生成器,实现暂停执行、按需返回值并保存状态,相比列表更节省内存,适用于处理大数据、惰性计算和无限序列,yield from则简化了子生成器委托,提升代码简洁性与可维护性。

yield 关键字的作用与生成器工作流程

yield
关键字在 Python 中扮演着一个非常独特的角色,它能将一个普通函数“转化”为生成器(generator)。简单来说,当你在一个函数中使用
yield
语句时,这个函数就不会立即执行完并返回一个单一结果,而是变成一个迭代器,每次被请求时才“暂停”执行并“吐出”一个值,然后记住它当前的所有状态,等待下一次被唤醒时从上次暂停的地方继续执行。这对于处理大量数据或构建惰性计算序列来说,是极其高效且优雅的解决方案。

yield
关键字的作用与生成器工作流程

在我看来,

yield
关键字是 Python 语言中一个非常精妙的设计,它彻底改变了函数的工作模式。一个包含
yield
的函数,当你调用它时,它并不会像普通函数那样直接运行函数体内的代码,而是返回一个特殊的迭代器对象,也就是我们常说的“生成器对象”。

这个生成器对象才是真正的工作者。当你对它调用

next()
方法(或者在
for
循环中迭代它)时,函数体内的代码才会开始执行,直到遇到第一个
yield
语句。此时,函数会“暂停”执行,将
yield
后面的值作为结果返回。更关键的是,它会把当前函数的所有局部变量和执行状态都保存下来。

当生成器对象再次被请求下一个值时(再次调用

next()
),函数会从上次暂停的地方,也就是上次
yield
语句之后的那一行,继续执行。这个过程会一直重复,直到函数体执行完毕,或者遇到
return
语句(此时生成器会抛出
StopIteration
异常,表示没有更多的值了)。

这种“按需生成”的模式,与传统的“一次性生成所有结果并存储”的模式形成了鲜明对比。它最直接的好处就是极大地节省内存。想象一下,如果你需要处理一个亿万级别的数据序列,把它全部加载到内存中几乎是不可能的。但如果用生成器,我们每次只需要处理一个数据项,内存占用就能保持在一个非常低的水平。

def simple_generator():
    print("开始生成...")
    yield 1
    print("生成了1,继续...")
    yield 2
    print("生成了2,快结束了...")
    yield 3
    print("生成完毕。")

# 调用函数,得到的是一个生成器对象
gen = simple_generator()

# 每次调用next(),函数才执行一部分
print(next(gen)) # 输出:开始生成... 1
print(next(gen)) # 输出:生成了1,继续... 2
print(next(gen)) # 输出:生成了2,快结束了... 3

# 再次调用会抛出StopIteration
# print(next(gen)) # 输出:生成了3,快结束了... 生成完毕。 StopIteration

你看,这个例子清晰地展示了

yield
如何控制函数的执行流。每次
next()
都像给生成器“打了一针兴奋剂”,让它向前走一步,吐出一个值,然后再次“冬眠”。

生成器与普通函数有何本质区别?为何选择生成器而非列表?

这问题问到了点子上,也是很多初学者容易混淆的地方。在我看来,生成器和普通函数最根本的区别在于它们的执行模型内存管理策略

普通函数是“一次性”的。当你调用一个普通函数时,它会从头到尾执行完毕,然后返回一个(或零个)结果。函数执行过程中产生的任何局部变量,在函数返回后就都“烟消云散”了。它就像一个短跑运动员,冲刺到底,然后休息。

而生成器函数则更像一个“马拉松运动员”,它会跑一段,停下来喘口气(

yield
),把当前跑到哪儿了、身体状态如何都记下来,然后把阶段性成果(
yield
的值)给你。等你下次需要时,它再从上次停下的地方接着跑。这种“暂停-恢复”的机制,使得生成器能够保存其内部状态,这是普通函数做不到的。

至于为什么选择生成器而非列表,核心考量就是效率资源消耗

  1. 内存效率: 这是生成器最大的优势。列表(list)会一次性将所有元素加载到内存中。如果你的数据量非常大,比如一个GB级别的日志文件,或者一个理论上无限的数字序列,将它们全部存入列表会直接导致内存溢出。生成器则不然,它每次只在需要时生成一个元素,内存中只保存当前生成状态和少量数据,极大地降低了内存占用。
  2. 惰性计算(Lazy Evaluation): 生成器是惰性求值的典范。它只计算你真正需要的部分。比如,你可能只需要一个序列的前100个元素,即使这个序列可以无限长,生成器也只会计算到第100个就停止。而如果你用列表来表示,即使你只取前100个,也可能需要先计算出所有元素。这在处理大型数据集或网络流时尤其重要。
  3. 无限序列: 只有生成器才能优雅地表示无限序列,比如斐波那契数列、质数序列等。因为它们不需要一次性生成所有元素,而是按需提供。

所以,如果你的数据量可控,或者你需要频繁地随机访问列表中的元素,那么列表可能是更好的选择。但如果你的数据量巨大、需要进行流式处理,或者希望实现惰性计算,那么生成器无疑是更明智、更高效的选择。

如何理解
yield from
的用法及其优势?

yield from
是 Python 3.3 引入的一个语法糖,它主要是为了简化委托给子生成器的逻辑。初看可能有点迷惑,但一旦理解了它的应用场景,你会发现它让代码变得非常简洁和强大。

想象一下,你有一个复杂的生成器,它需要从多个不同的“源”生成数据。在

yield from
出现之前,你可能会写出这样的代码:

淄博分类信息港程序seo特别版
淄博分类信息港程序seo特别版

seo特别版程序介绍:注意:普通用户建议使用淄博分类信息港程序普通版本。主要针对seo需要增加了自定义功能:自定义文件路径;自定义文件名;自定义关键字。这些功能的作用,只有自己体会了。以下是淄博分类信息港程序的介绍:淄博分类信息港程序一套现成的城市分类信息网站发布系统。发布管理房屋、人才、招租、招聘、求购、求租、搬迁、运输、二手交易、招生培训、婚介交友等各类信息的发布和查询。淄博分类信息港发布程序

下载
def sub_generator_a():
    yield 'A1'
    yield 'A2'

def sub_generator_b():
    yield 'B1'
    yield 'B2'

def main_generator_old():
    for item in sub_generator_a():
        yield item
    for item in sub_generator_b():
        yield item

# 使用旧方法
for x in main_generator_old():
    print(x)
# 输出:A1 A2 B1 B2

这段代码虽然能工作,但

for item in ... yield item
这种模式写多了会显得有些冗余。
yield from
就是来解决这个问题的。它允许一个生成器直接将迭代的控制权委托给另一个迭代器(通常是另一个生成器)。

使用

yield from
后,代码会变得更简洁:

def sub_generator_a():
    yield 'A1'
    yield 'A2'

def sub_generator_b():
    yield 'B1'
    yield 'B2'

def main_generator_new():
    yield from sub_generator_a() # 委托给sub_generator_a
    yield from sub_generator_b() # 委托给sub_generator_b

# 使用新方法
for x in main_generator_new():
    print(x)
# 输出:A1 A2 B1 B2

这看起来只是简化了代码,但

yield from
的能力远不止于此。它不仅仅是语法糖,更重要的是,它能够透明地处理子生成器的所有通信,包括
send()
throw()
close()
方法。这意味着外部调用者可以直接与子生成器进行交互,而不需要主生成器做额外的转发处理。这在构建更复杂的协程(coroutines)和异步编程模式时,显得尤为重要,因为它允许数据和控制流在多层生成器之间无缝传递。

简而言之,

yield from
的优势在于:

  1. 代码更简洁: 避免了冗余的
    for item in ... yield item
    模式。
  2. 更强大的委托: 不仅传递
    yield
    的值,还能处理
    send()
    throw()
    等方法,使得子生成器能够接收外部输入或处理异常。
  3. 构建复杂生成器链: 使得多个生成器可以像乐高积木一样组合起来,形成一个更强大的数据处理管道。

生成器在实际开发中常见的应用场景有哪些?

生成器在实际开发中简直是无处不在,尤其是在需要处理大量数据或构建高效数据流的场景。我个人在很多项目中都依赖它来优化性能和内存。

  1. 处理大型文件: 这是最经典的场景之一。比如,你需要读取一个几十GB的日志文件或CSV文件。如果一次性

    readlines()
    ,内存肯定吃不消。使用生成器可以逐行读取,每次只在内存中保留一行数据进行处理。

    def read_large_file(filepath):
        with open(filepath, 'r', encoding='utf-8') as f:
            for line in f:
                yield line.strip()
    
    # 逐行处理文件,而不会一次性加载所有内容
    for log_entry in read_large_file('my_huge_log.txt'):
        if "ERROR" in log_entry:
            print(f"发现错误:{log_entry}")
  2. 数据流处理管道: 当你需要对数据进行一系列的转换、过滤操作时,生成器可以构建一个高效的“数据处理管道”。每个生成器负责一个步骤,将处理后的结果

    yield
    给下一个生成器。

    def filter_even(numbers):
        for n in numbers:
            if n % 2 == 0:
                yield n
    
    def square(numbers):
        for n in numbers:
            yield n * n
    
    # 构建管道:生成数字 -> 过滤偶数 -> 求平方
    nums = range(1, 11)
    processed_data = square(filter_even(nums)) # 惰性求值
    
    for res in processed_data:
        print(res) # 输出:4 16 36 64 100

    这种链式调用,每个步骤都是惰性的,只有在真正需要结果时才计算。

  3. 实现自定义迭代器: 如果你需要一个自定义的数据结构,或者希望以非传统方式遍历一个对象,生成器提供了一种非常简洁的方式来实现

    __iter__
    方法,让你的对象变得可迭代。

  4. 无限序列的生成: 像斐波那契数列、质数生成器等,它们本质上是无限的。生成器是唯一能在不耗尽内存的情况下表示和使用这些序列的方式。

    def fibonacci_sequence():
        a, b = 0, 1
        while True:
            yield a
            a, b = b, a + b
    
    fib_gen = fibonacci_sequence()
    for _ in range(10):
        print(next(fib_gen)) # 输出前10个斐波那契数
  5. 资源管理(配合

    contextlib.contextmanager
    ): 虽然不是直接使用
    yield
    ,但
    contextlib.contextmanager
    装饰器就是基于生成器实现的,它提供了一种简洁的方式来创建上下文管理器,确保资源的正确获取和释放(比如文件句柄、数据库连接等)。

这些场景都体现了生成器在提高代码效率、降低内存消耗和增强代码可读性方面的巨大价值。掌握了

yield
,你就掌握了 Python 中处理大规模数据和构建高效数据流的利器。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

778

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

685

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

769

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

739

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1445

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

571

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

580

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

751

2023.08.11

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

1

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 21.8万人学习

Django 教程
Django 教程

共28课时 | 3.5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号