
本文介绍在使用 `pandas.excelfile` 逐个读取并遍历 excel 工作表时,如何正确释放文件句柄以避免“文件被占用”导致的 `winerror 32` 权限错误,确保后续 `os.rename()` 操作成功执行。
在批量处理 Excel 文件时,许多开发者会习惯性地使用 pd.ExcelFile 来获取工作表名并按需读取(例如 file.parse(sheet)),这比直接用 pd.read_excel() 更灵活。但关键区别在于:pd.ExcelFile 是一个持久化的文件句柄对象,它底层持有一个打开的 xlrd、openpyxl 或 pyxlsb 文件流(取决于引擎),而该流不会自动关闭——即使循环结束或变量超出作用域,Python 的垃圾回收也不保证立即释放系统级文件锁,尤其在 Windows 上极易触发 [WinError 32] The process cannot access the file because it is being used by another process。
正确的做法是在完成所有 sheet 处理后,显式调用 .close() 方法释放资源。注意:不是 del file,也不是依赖 with 语句(ExcelFile 当前不支持上下文管理协议),而是必须主动关闭:
import os
import pandas as pd
directory = r"C:\path\to\source"
destination = r"C:\path\to\dest"
os.chdir(directory)
for filename in os.listdir(directory):
if not filename.endswith(('.xlsx', '.xls', '.xlsm')):
continue # 跳过非 Excel 文件
filepath = os.path.join(directory, filename)
try:
excel_file = pd.ExcelFile(filepath)
# 遍历所有工作表(示例:仅打印名称,实际中可 concat 或处理)
for sheet_name in excel_file.sheet_names:
df = excel_file.parse(sheet_name)
# ✅ 在此处对 df 进行数据清洗、合并等操作
# ⚠️ 关键步骤:显式关闭 ExcelFile 对象,释放文件锁
excel_file.close()
# 此时 rename 才能安全执行
dest_path = os.path.join(destination, filename)
os.rename(filepath, dest_path)
print(f"✓ 移动成功: {filename}")
except Exception as e:
print(f"✗ 处理失败 {filename}: {e}")⚠️ 注意事项:
- pd.ExcelFile.close() 是必需的,不可省略;仅 del excel_file 或让变量自然消失无法保证及时释放;
- 建议添加 try...except 包裹单文件处理逻辑,防止某文件出错导致整个流程中断;
- 使用 os.path.join() 替代字符串拼接(如 f"{directory}\\{files}"),提升跨平台兼容性;
- 若需更高鲁棒性,可结合 shutil.move() 替代 os.rename()(后者要求源与目标在同一磁盘分区);
- 对于超大 Excel 文件,还可考虑在 close() 后加入 gc.collect() 强制触发垃圾回收(极少需要,仅作备选)。
总结:pd.ExcelFile 提供了灵活的多 Sheet 访问能力,但代价是需手动资源管理。牢记「打开即负责关闭」原则——每次 pd.ExcelFile(...) 后,必跟 .close(),这是规避 Windows 文件锁定问题最直接、最可靠的实践。
立即学习“Python免费学习笔记(深入)”;










