Python迭代器协议核心是__iter__和__next__两个方法:前者返回迭代器对象(可为self或新实例),后者返回下一项或抛StopIteration;遵守该协议即支持for循环等操作,无需继承或装饰。

Python迭代器协议的核心是两个方法:__iter__ 和 __next__。只要一个对象实现了这两个方法,它就能被 for 循环、list()、next() 等工具直接使用——不需要继承任何类,也不依赖特殊装饰,纯粹靠约定。
迭代器协议的两个关键方法
__iter__ 必须返回一个迭代器对象(通常就是 self,也可以是新创建的迭代器实例);__next__ 每次调用返回下一个值,没有更多元素时抛出 StopIteration 异常。Python 内部正是靠捕获这个异常来判断迭代结束。
- 如果
__iter__返回的是自身(且自身有__next__),那它既是可迭代对象,也是迭代器(单遍历、不可重用) - 如果
__iter__每次都返回一个新的独立迭代器,那该对象就支持多次遍历(如list、str) -
__next__不能返回None作为有效数据,因为next(it, default)用None表示“取不到”,容易混淆
自定义只读序列迭代器(支持多次遍历)
想让自己的容器类(比如一个封装了列表的 MyList)支持 for 循环和 list(my_obj),推荐分离「可迭代对象」和「迭代器」角色:
- 在容器类中实现
__iter__,每次返回一个新的迭代器实例 - 单独写一个迭代器类,实现
__next__和__iter__(通常直接return self) - 这样能天然支持多线程或嵌套循环中各自独立遍历,避免状态冲突
例如:MyList([1,2,3]).__iter__() 返回 MyListIterator 实例,每次调用都从头开始。
立即学习“Python免费学习笔记(深入)”;
实现单次消耗型迭代器(节省内存)
适合处理流式数据、大文件或生成逻辑复杂的结果。这类对象本身既是可迭代对象,也是迭代器:
-
__iter__直接return self -
__next__维护内部状态(如索引、文件指针、随机数种子),每次推进并返回新值 - 一旦抛出
StopIteration,再次调用next()仍会抛异常——不可重用
典型例子:逐行读取大文件的迭代器、斐波那契数列生成器(手动实现版)、数据库游标封装。
与生成器函数的关系
用 yield 写的生成器函数,调用后自动返回一个符合迭代器协议的对象。它的底层就是 Python 自动帮你实现了 __iter__ 和 __next__,并管理好暂停/恢复、状态保存等细节。所以你无需手动写这些方法,但理解协议有助于调试和设计更灵活的迭代逻辑——比如在生成器里加缓存、重试、日志,或混合多种数据源。
不复杂但容易忽略:协议本身无类型检查、无强制规范,全靠开发者自觉遵守;只要方法名对、行为对,Python 就认。










