生成器对象遍历一次后耗尽,无法重置;可通过五种方法实现多次迭代:一、每次调用生成器函数新建实例;二、封装为实现__iter__的可迭代类;三、用itertools.tee复制迭代器;四、缓存为元组或列表;五、用闭包延迟生成新生成器。

如果定义了一个生成器函数,调用它返回的生成器对象在遍历一次后即耗尽,后续迭代将不再产生任何值。这是因为生成器对象内部状态不可重置。以下是实现多次迭代能力的几种不同方法:
一、每次调用生成器函数重新创建生成器
该方法不复用原有生成器对象,而是每次迭代前重新调用生成器函数,从而获得一个全新的、未开始消耗的生成器实例。
1、定义原始生成器函数,例如:def my_gen(): yield from [1, 2, 3]。
2、在需要迭代的位置,显式调用该函数:for x in my_gen(): print(x)。
立即学习“Python免费学习笔记(深入)”;
3、再次迭代时,再次调用:for x in my_gen(): print(x),此时获得的是全新生成器。
二、封装为可迭代类并实现 __iter__ 方法
通过定义一个类,在其 __iter__ 方法中返回新生成器,使该类实例支持无限次 for 循环调用。
1、创建类,例如:class ReusableGenerator:。
2、在类中定义 __iter__(self): return my_gen()(假设 my_gen 是原生成器函数)。
3、实例化该类:gen_obj = ReusableGenerator()。
4、可重复使用:list(gen_obj)、list(gen_obj) 均返回完整结果。
三、使用 itertools.tee 复制生成器迭代器
itertools.tee 可从单个迭代器派生多个独立迭代器,各迭代器互不影响,适用于需同时或分时多次遍历同一数据流的场景。
1、导入模块:from itertools import tee。
2、获取原始生成器:g = my_gen()。
3、复制为两个独立迭代器:g1, g2 = tee(g)。
4、分别消费:list(g1) 和 list(g2) 均得到完整输出。
四、将生成器内容缓存为元组或列表
若生成器产出数据量适中且可全部驻留内存,则可一次性展开并缓存,后续迭代直接基于该不可变序列进行。
1、调用生成器并转为元组:cached = tuple(my_gen())。
2、后续所有迭代均作用于该元组:for x in cached: ...。
3、也可定义为属性或闭包变量,避免重复计算:def make_cached_gen(): data = tuple(my_gen()); return lambda: iter(data)。
五、使用闭包捕获生成器逻辑并延迟执行
构造一个可调用对象,每次调用时返回新的生成器,逻辑封装在闭包内,避免外部暴露原始生成器定义。
1、定义闭包工厂函数:def reusable_gen(): return (x for x in [1, 2, 3])。
2、调用该函数获取新生成器:g = reusable_gen()。
3、迭代完成后,再次调用:g2 = reusable_gen(),获得独立实例。
4、亦可进一步包装为类的 __call__ 方法,提供更清晰接口。










