Python怎么遍历文件夹中的所有文件_Python文件目录遍历技巧

冰火之心
发布: 2025-09-15 21:39:01
原创
700人浏览过
答案:Python通过os.walk()遍历文件夹,返回目录路径、子目录列表和文件列表的三元组。可结合file.endswith()筛选特定类型文件,使用os.path.join()构建完整路径以处理中文文件名并指定编码避免乱码。通过dirs[:]过滤符号链接防止无限循环,用try-except捕获权限错误,提升遍历安全性与效率。

python怎么遍历文件夹中的所有文件_python文件目录遍历技巧

Python遍历文件夹,本质上就是让你能够用程序化的方式,去“走一遍”你电脑里的文件夹,找到所有你需要的文件。这听起来很简单,但实际上用途非常广泛,比如批量处理文件、统计文件数量等等。

解决方案

Python提供了

os
登录后复制
os.path
登录后复制
模块来处理文件和目录。最常用的方法是结合
os.walk()
登录后复制
函数。

os.walk(directory)
登录后复制
会返回一个生成器,每次迭代都会返回一个三元组
(root, dirs, files)
登录后复制

立即学习Python免费学习笔记(深入)”;

  • root
    登录后复制
    : 当前正在访问的目录路径(字符串)。
  • dirs
    登录后复制
    :
    root
    登录后复制
    下所有子目录的名称列表(字符串列表)。
  • files
    登录后复制
    :
    root
    登录后复制
    下所有文件的名称列表(字符串列表)。

下面是一个基本的遍历文件夹的例子:

import os

def traverse_directory(directory):
    for root, dirs, files in os.walk(directory):
        print(f"当前目录: {root}")
        for file in files:
            print(f"  文件: {file}")
        for dir in dirs:
            print(f"  目录: {dir}")

# 使用示例
traverse_directory("/path/to/your/directory")  # 替换成你的文件夹路径
登录后复制

这个代码会打印出指定文件夹及其所有子文件夹下的所有文件和目录。

如何根据文件类型筛选文件?

实际应用中,你可能只想处理特定类型的文件,比如只处理

.txt
登录后复制
文件。这时,可以在遍历时加入判断:

import os

def traverse_txt_files(directory):
    for root, dirs, files in os.walk(directory):
        for file in files:
            if file.endswith(".txt"):
                file_path = os.path.join(root, file) # 获取完整的文件路径
                print(f"找到TXT文件: {file_path}")
                # 在这里可以对文件进行处理,比如读取内容
                # with open(file_path, 'r', encoding='utf-8') as f:
                #     content = f.read()
                #     print(content)

# 使用示例
traverse_txt_files("/path/to/your/directory")
登录后复制

这里,

file.endswith(".txt")
登录后复制
判断文件名是否以
.txt
登录后复制
结尾。
os.path.join(root, file)
登录后复制
用于构建文件的完整路径,这很重要,因为
os.walk
登录后复制
返回的文件名只是文件名本身,不包含路径信息。

巧文书
巧文书

巧文书是一款AI写标书、AI写方案的产品。通过自研的先进AI大模型,精准解析招标文件,智能生成投标内容。

巧文书 61
查看详情 巧文书

如何处理中文文件名?

在处理中文文件名时,需要注意编码问题。通常,确保你的Python脚本使用UTF-8编码,并在打开文件时指定编码方式,可以避免乱码问题。

如何避免遍历符号链接导致的无限循环?

如果你的文件夹中包含符号链接(类似于快捷方式),

os.walk()
登录后复制
可能会陷入无限循环。你可以使用
os.path.islink()
登录后复制
来判断是否为符号链接,并选择跳过它们。

import os

def traverse_without_links(directory):
    for root, dirs, files in os.walk(directory):
        dirs[:] = [d for d in dirs if not os.path.islink(os.path.join(root, d))] # 修改dirs列表,跳过符号链接
        for file in files:
            print(f"文件: {file}")

# 使用示例
traverse_without_links("/path/to/your/directory")
登录后复制

注意

dirs[:] = ...
登录后复制
这种写法。 它直接修改了
dirs
登录后复制
列表本身,而不是创建一个新的列表。 这样
os.walk()
登录后复制
在下次迭代时,就不会进入被排除的目录。

如何提高遍历速度?

如果你的文件夹结构非常复杂,文件数量巨大,遍历速度可能会比较慢。 有一些方法可以提高速度:

  • 使用多线程/多进程: 将遍历任务分解成多个子任务,并行执行。
  • 使用更高效的库: 某些第三方库(比如
    scandir
    登录后复制
    )可能比
    os.walk()
    登录后复制
    更快。
  • 减少不必要的I/O操作: 如果只需要文件名,避免读取文件内容。

如何处理权限错误?

在遍历某些受保护的文件夹时,可能会遇到权限错误。 可以使用

try...except
登录后复制
语句来捕获
PermissionError
登录后复制
异常,并进行处理,比如跳过该文件夹。

以上就是Python怎么遍历文件夹中的所有文件_Python文件目录遍历技巧的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号