os.walk()返回(root, dirs, files)三元组:root为当前目录路径,dirs为子目录名列表(可修改以控制遍历),files为文件名列表;均不带路径,需os.path.join拼接。

用 os.walk() 遍历目录,核心是理解它返回的三元组结构和遍历顺序——它按深度优先、自顶向下(默认)逐层访问,每次迭代给出当前目录路径、子目录名列表、文件名列表。
os.walk() 返回值到底是什么?
每次循环得到的是一个包含三个元素的元组:(root, dirs, files):
- root:当前正在访问的目录的绝对或相对路径(字符串)
- dirs:该目录下所有子目录名组成的列表(不带路径,仅文件名),可修改——这是控制遍历范围的关键
- files:该目录下所有普通文件名组成的列表(同样不带路径)
注意:dirs 和 files 都是纯名称列表,不含路径;若需完整路径,需用 os.path.join(root, name) 拼接。
如何跳过某些目录或提前终止遍历?
因为 dirs 列表在每次迭代中可被就地修改,所以能动态控制下一层访问目标:
本文档主要讲述的是Android平台ROM的定制及精简教程;本教程主要内容有:Android系统文件夹结构解析、应用软件说明、定制精简、ROM签名把包等内容。本教程测试平台为HTC G2、G3这两个型号,其它机型可以借鉴,刷机有风险,出问题自负。希望本文档会给有需要的朋友带来帮助;感兴趣的朋友可以过来看看
立即学习“Python免费学习笔记(深入)”;
- 跳过某个子目录:在循环体内执行
dirs.remove("temp")或dirs[:] = [d for d in dirs if d != "node_modules"] - 只遍历指定层级(如仅当前目录+下一层):可在进入某层前检查
root.count(os.sep)(Windows 用root.count("\\")),超深则清空dirs - 遇到特定目录立即退出:用
break可终止当前循环,但不会中断整个遍历;真正中止需用异常或标志位
常见实用场景写法示例
不必每次都从头写循环,针对典型需求有简洁模式:
-
查找所有 .py 文件:
if file.endswith(".py"): print(os.path.join(root, file)) -
统计各目录下文件数:记录
len(files),配合root输出即可 -
生成目录树结构:根据
root深度计算缩进,再拼接dirs + files名称 - 安全批量重命名:先收集待处理文件全路径,确认无误后再操作,避免边遍历边改名引发错乱
要注意的坑和替代建议
os.walk() 简单直接,但有些边界情况需留意:
- 路径含中文或特殊字符时,确保 Python 运行环境编码支持(通常 UTF-8 没问题)
- 遇到权限错误(如无读取权限的目录)会抛
PermissionError,建议用try/except包裹整个循环 - 符号链接默认不跟进(
followlinks=False),设为True可能导致无限循环,慎用 - Python 3.5+ 推荐用
pathlib.Path.rglob()替代简单查找(如list(p.rglob("*.log"))),更函数式、易读;复杂逻辑仍推荐os.walk()









