0

0

Python pathlib.Path 如何递归获取所有 .py 文件(不使用 os.walk)

冰川箭仙

冰川箭仙

发布时间:2026-01-24 19:44:02

|

245人浏览过

|

来源于php中文网

原创

rglob是首选方案,因其为pathlib内置递归glob方法,语义明确、跨平台稳定、内存友好且语法简洁;需配合try/except处理权限错误,用p.suffix.lower()兼容大小写,通过p.parts过滤排除目录。

python pathlib.path 如何递归获取所有 .py 文件(不使用 os.walk)

pathlib.Path.rglob 为什么是首选方案

rglobpathlib.Path 内置的递归 glob 方法,专为替代 os.walk 设计。它返回一个生成器,延迟遍历,内存友好,且语法简洁。不用手动处理目录层级、过滤逻辑或异常跳过——只要路径存在且可读,它就自动往下钻。

常见错误是写成 path.glob("**/*.py"):这其实也能工作,但 **glob 中不保证跨平台递归(尤其在旧版 Python 或某些文件系统上行为不一致),而 rglob 明确语义、稳定支持所有平台。

  • 必须用 rglob,不是 glob
  • 模式字符串直接写 "*.py" 即可,rglob 默认从当前路径向下全递归
  • 如果只想搜子目录(不含当前目录),可用 path.joinpath("**").rglob("*.py"),但通常不需要

如何正确处理权限不足或符号链接循环

rglob 遇到无法访问的目录(如 PermissionError)会直接抛异常,中断整个遍历。这不是 bug,而是默认行为。实际项目中必须捕获并跳过:

from pathlib import Path

def safe_py_files(root: Path): for p in root.rglob("*.py"): try: if p.is_file(): # 确保是文件,排除可能的 broken symlink yield p except (OSError, RuntimeError): continue # 跳过权限错误、循环软链、设备忙等

  • p.is_file() 必须显式调用,因为 rglob("*.py") 可能匹配到同名目录(极少见但可能)
  • 不要依赖 ignore_errors=True —— rglob 没这个参数,得自己 try/except
  • 符号链接默认被跟随;若需跳过软链,加 if not p.is_symlink()

Windows 下大小写敏感问题怎么破

Windows 文件系统默认不区分大小写,但 rglob("*.py") 严格按字面匹配。如果目录里有 SCRIPT.PYmain.Py,它们不会被命中。

立即学习Python免费学习笔记(深入)”;

Andi
Andi

智能搜索助手,可以帮助解决详细的问题

下载

解决方式不是改模式,而是后过滤:

py_files = [p for p in root.rglob("*") if p.is_file() and p.suffix.lower() == ".py"]
  • "*" 先拉所有文件,再用 p.suffix.lower() 判断,兼容所有大小写变体
  • 性能略低(遍历更多条目),但比写多个模式("*.py", "*.PY", "*.Py"…)干净得多
  • Linux/macOS 下也建议统一用这种写法,避免跨平台差异

想排除 __pycache__ 和 venv 目录怎么办

rglob 本身不支持排除路径,得靠 Python 层过滤。最简方式是检查 p.parent 名称:

excludes = {"__pycache__", "venv", ".venv", "env"}
py_files = [
    p for p in root.rglob("*.py")
    if p.is_file() and all(part not in excludes for part in p.parts)
]
  • p.parts 返回路径各段元组(如 PosixPath("/a/b/venv/lib/site.py").parts == ('/', 'a', 'b', 'venv', 'lib', 'site.py')),比用 str(p) 正则更可靠
  • 注意 venv 可能出现在任意层级,所以要检查全部 part,不能只看 p.parent.name
  • 如果项目用 Poetry 或 Pipenv,可额外加入 ".poetry"、".pipenv"

实际递归找 .py 文件,核心就三件事:用对 rglob、兜住 OSError、按需处理大小写和排除目录。细节都在路径对象自己的方法里,不用引入额外模块,但每一步漏掉都可能在 CI、Docker 或 Windows 上突然出问题。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

773

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

684

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

765

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

699

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1405

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

570

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

579

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

751

2023.08.11

c++ 根号
c++ 根号

本专题整合了c++根号相关教程,阅读专题下面的文章了解更多详细内容。

22

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.7万人学习

Git 教程
Git 教程

共21课时 | 2.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号