Python多文件处理教程_目录遍历与批量操作

冷炫風刃

发布时间：2026-01-09 16:24:09

537人浏览过

来源于php中文网

原创

Python处理多层文件结构推荐pathlib.rglob()，批量读写需按需加载并指定编码，重命名移动要校验存在性，过滤统计用关键词或后缀，脚本化应加argparse、tqdm和错误日志。

python多文件处理教程_目录遍历与批量操作

遍历目录：用 os.walk() 和 pathlib 处理多层文件结构

处理多个文件时，第一步往往是找到它们。Python 提供了两种主流方式：传统 os.walk() 和更现代的 pathlib.Path.rglob()。

os.walk() 返回三元组（根路径、子目录名列表、文件名列表），适合需要同时操作目录层级信息的场景：

逐层进入子目录，可控制是否跳过某些文件夹（通过修改 dirnames 列表）
对每个目录下的文件做统一判断，比如只处理 .py 或 .txt 文件
示例中常配合 os.path.join(root, file) 构建完整路径，避免路径拼接错误

pathlib 更简洁直观，推荐新项目使用：

Path("data").rglob("*.log") 直接获取所有匹配的日志文件路径对象
路径对象自带 .stem、.suffix、.parent 等属性，无需额外拆解字符串
支持链式调用，比如 p.resolve().is_file() 安全判断是否存在且为文件

批量读写文件：避免内存爆炸与编码陷阱

一次打开几百个文件？别直接用 open() 全部加载——容易触发 MemoryError 或乱码。关键在“按需”和“统一编码”。

TemPolor

AI音乐生成器，一键创作免版税音乐

下载

立即学习“Python免费学习笔记（深入）”；

用 with open(...) 保证自动关闭，即使出错也不留句柄
文本文件务必显式指定 encoding="utf-8"（Windows 记事本保存的 ANSI 文件除外，可用 "gbk" 或 chardet 检测）
大文件不用 read() 全读，改用 for line in f: 逐行处理；二进制文件用 f.read(8192) 分块读取
写入前检查目标目录是否存在：Path(out_dir).mkdir(parents=True, exist_ok=True)

常见批量操作：重命名、移动、过滤与统计

实际工作中，多数需求逃不开这几类动作。核心是“先查后动”，加一层安全校验。

重命名：用 rename() 前先用 exists() 检查目标名是否已存在，避免覆盖；建议加时间戳或序号前缀，如 f"backup_{p.stem}_{int(time.time())}{p.suffix}"
移动/复制：shutil.move() 和 shutil.copy2() 保留修改时间等元数据；跨磁盘移动本质是复制+删除，大文件注意磁盘空间
按内容过滤：比如只处理含特定关键词的文件，可用 if "ERROR" in f.read():，但记得小文件才全文读，否则用正则逐行 scan
快速统计：统计总大小用 sum(p.stat().st_size for p in files)，统计类型分布用 Counter(p.suffix for p in files)

封装成可复用脚本：加参数、进度条与错误日志

临时脚本跑一次就丢？稍加改造就能变成团队共享工具。

用 argparse 接收路径、后缀、动作类型等参数，比如 python batch.py -d ./logs -e .log --action clean
处理大量文件时加 tqdm(files) 显示进度条，用户不干等
异常不能吞掉：对每个文件单独 try/except，记录失败路径到 error.log，不影响其余文件执行
操作前打印将要处理的文件数和预估影响范围，加 --dry-run 参数先预览不执行

字符串拼接时意外引入多余引号导致API请求失败的解决方案

python getsize如何使用

Python配置管理实战教程_YAMLINIJSON多环境管理技巧

python有哪些语法元素

python 头文件怎么写

相关标签:

python windows 编码工具 win Python batch if for 封装 try Error 字符串 int 对象 windows

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python数据模型教程_对象协议与行为定制下一篇：PythonAI模型过拟合教程_深度学习常见问题

作者最新文章

艾诺迪亚4地图全解锁_艾诺迪亚4全地图位置怪物掉落详解

2026-01-09 09:03

Python时间序列分析教程_Pandas时间索引实践

2026-01-09 09:08

千焦单位热量换算指南_千焦单位与大卡卡路里转换关系

2026-01-09 09:10

劳动仲裁需要本人去吗_劳动仲裁不一定本人到场可委托代理人参加

2026-01-09 09:27

无人机驾驶证报考官网入口uom

2026-01-09 09:33

SQL高可用选型分析_MySQL与PostgreSQL对比

2026-01-09 09:50

小米手机怎么开空调遥控_小米手机红外遥控空调开启方法

2026-01-09 11:11

oppo官网怎么查激活时间_OPPO序列号查询激活日期入口

2026-01-09 11:45

在哪里关闭抖音商城功能路径与教程

2026-01-09 12:09

Python大模型提示工程教程_Prompt设计技巧

2026-01-09 12:09

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

742

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

634

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

756

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

617

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1259

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

705

2023.08.11