Python迭代器是__iter__和__next__构成的协议;for能遍历列表因其实现__iter__,整数无此方法故不可迭代;iter()先查__iter__再试__getitem__(0);StopIteration在for中为正常退出信号,手动next()需捕获;生成器函数比手写类更轻量安全;itertools工具返回惰性迭代器,chain/islice/tee不缓存全量数据。

Python 迭代器不是语法糖,而是 __iter__ 和 __next__ 两个方法共同构成的协议;只要对象实现了这个协议,它就是迭代器——哪怕没继承 Iterator 类。
为什么 for 循环能遍历列表但不能直接遍历整数
因为 list 实现了 __iter__,返回一个迭代器对象;而 int 没有该方法,调用 iter(42) 会抛出 TypeError: 'int' object is not iterable。关键不在类型,而在是否响应 iter() 调用。
-
iter(obj)先尝试调用obj.__iter__() - 若未实现,再尝试
obj.__getitem__(0)(仅限从 0 开始的连续索引) - 两者都失败,才报错
StopIteration 是信号,不是异常(在循环里)
手动调用 next(it) 时,StopIteration 真的是异常,必须捕获;但在 for 中它是正常退出机制,不会暴露给用户。误把 next(it) 放进循环体又不捕获,会导致程序中断。
it = iter([1, 2]) print(next(it)) # 1 print(next(it)) # 2 print(next(it)) # 触发 StopIteration —— 此处不捕获就会报错
生成器函数比手写迭代器类更轻量、更安全
手写类需显式维护状态、处理边界、返回 self 和 raise StopIteration;生成器函数用 yield 自动封装这些逻辑,且天然支持暂停/恢复。
立即学习“Python免费学习笔记(深入)”;
- 类迭代器容易漏写
__iter__返回self,导致多次for循环复用同一个迭代器失效 - 生成器函数每次调用
func()都返回新迭代器,无状态污染 -
yield from可委托子生成器,避免手动for + yield
itertools 中的 chain、islice、tee 不缓存全部数据
它们返回的是惰性迭代器,只在被消费时计算。例如 islice(range(10**9), 10) 不会构造十亿元素的列表,只取前 10 个;但 tee(it, 2) 会内部缓存已读未分发的项,若一个分支远超另一个,内存可能涨得很快。
-
chain(a, b):串联多个可迭代对象,不展开、不复制 -
islice(it, start, stop, step):类似切片,但不支持负索引 -
tee(it, n):拆成n个独立迭代器,底层共享一个缓冲区
真正难的不是写出能跑的迭代器,而是判断什么时候该用生成器函数、什么时候该用 itertools 组合、什么时候必须手写类(比如需要带参数重置状态的流式解析器)。










