Python迭代器是运行时底层协议,非语法糖;for循环隐式调用iter(),要求对象实现__iter__或__getitem__;int不满足故报错;迭代器一次性、需处理StopIteration;生成器是迭代器子类。

Python 的迭代器不是语法糖,是语言运行时底层协议的体现;掌握它不靠死记 __iter__ 和 __next__,而在于理解「谁在调用、何时中断、状态如何保存」。
为什么 for 循环能遍历 list 却不能直接遍历 int?
因为 for 语句背后隐式调用 iter(),而该函数只接受实现了 __iter__(返回迭代器)或 __getitem__(支持整数索引且从 0 开始)的对象。int 没有这两个方法,所以报 TypeError: 'int' object is not iterable。
-
list、str、dict都实现了__iter__,返回各自对应的迭代器对象(如list_iterator) -
range是个特例:它本身是可迭代对象,但不依赖__getitem__,而是通过__iter__返回一个轻量级的range_iterator - 自定义类只要返回一个带
__next__方法的对象(不管是不是自身),就能被for消费
手动模拟 for 循环:用 try/except 处理 StopIteration 才是关键
写迭代器时最容易忽略的是异常边界——StopIteration 不是错误,而是协议约定的终止信号。Python 内部用它跳出循环,你手动调用 next() 时必须处理它。
numbers = iter([1, 2, 3])
while True:
try:
print(next(numbers))
except StopIteration:
break
- 漏掉
try/except会导致程序崩溃,尤其在不确定长度的生成逻辑中(比如读文件、网络流) -
next(iterator, default)可以避免异常,但仅适用于需要默认值的场景;无法区分「到底有没有下一个」和「就是到头了」 - 生成器函数(含
yield)自动封装了StopIteration抛出逻辑,所以不用手动写
迭代器 vs 生成器 vs 可迭代对象:三者关系一张图说清
可迭代对象(Iterable)是顶层接口,迭代器(Iterator)是具体实现,生成器(Generator)是迭代器的一种子类型(也是可迭代对象)。
立即学习“Python免费学习笔记(深入)”;
- 可迭代对象:有
__iter__方法,调用后返回一个迭代器(如[].__iter__()) - 迭代器:有
__iter__(通常返回自身)和__next__(返回下一个值或抛StopIteration) - 生成器:由
yield定义的函数返回的对象,本质是迭代器,但多了send()、throw()、close()等协程能力
判断方式:from collections.abc import Iterator, Iterable,再用 isinstance(obj, Iterator) 或 isinstance(obj, Iterable)。
真实项目里迭代器最常踩的坑:状态残留与不可重用
迭代器是一次性消耗品。一旦抛出 StopIteration,它就进入终态,后续任何 next() 调用都继续抛异常。这不是 bug,是设计使然。
- 把同一个迭代器对象传给多个函数,第二个函数会立即遇到
StopIteration - 想重复使用?得重新调用
iter()(比如iter(my_list))或重构为可迭代对象(加__iter__返回新迭代器) - 生成器函数每次调用都会返回新生成器对象,天然规避这个问题;但生成器对象本身仍是一次性的
复杂点在于:有些第三方库返回的“迭代器”其实是带缓存或惰性求值逻辑的封装,表面像迭代器,实则内部维护状态机——这时得看文档,不能只靠 isinstance(..., Iterator) 判断行为。










