Python高效处理多个Excel文件:数据提取与整理
本文介绍如何使用Python脚本高效地处理多个Excel文件,将数据分别提取并保存到不同的表格中。我们将利用Python的openpyxl库实现此功能,该库功能强大且易于使用。
核心步骤及代码详解
本方法主要包含三个步骤:打开Excel文件、读取指定区域数据、将数据写入新文件。
立即学习“Python免费学习笔记(深入)”;
1. 读取Excel文件并指定数据区域:
我们使用openpyxl库的load_workbook函数打开Excel文件,并通过sheet.iter_rows方法迭代读取指定行和列的数据。
from openpyxl import load_workbook def read_excel_range(filepath, sheet_name, start_row, end_row, start_col, end_col): """读取Excel指定区域的数据""" try: workbook = load_workbook(filepath, read_only=True) # read_only提高效率 sheet = workbook[sheet_name] data = [] for row in sheet.iter_rows(min_row=start_row, max_row=end_row, min_col=start_col, max_col=end_col): row_data = [cell.value for cell in row] data.append(row_data) workbook.close() return data except FileNotFoundError: print(f"Error: File not found - {filepath}") return None except Exception as e: print(f"Error reading Excel file: {e}") return None
2. 创建并写入新的Excel文件:
使用openpyxl库的Workbook和write方法创建新的Excel文件并写入数据。
from openpyxl import Workbook def write_excel(filepath, sheet_name, data): """将数据写入新的Excel文件""" try: workbook = Workbook() sheet = workbook.create_sheet(sheet_name) for row in data: sheet.append(row) workbook.save(filepath) workbook.close() except Exception as e: print(f"Error writing to Excel file: {e}")
3. 批量处理多个Excel文件:
使用循环处理多个文件,并调用上述函数完成数据提取和保存。
import os def process_excel_files(input_dir, output_dir, sheet_name='Sheet1', start_row=1, end_row=100, start_col=1, end_col=10): """批量处理Excel文件""" for filename in os.listdir(input_dir): if filename.endswith(".xlsx") or filename.endswith(".xls"): filepath = os.path.join(input_dir, filename) data = read_excel_range(filepath, sheet_name, start_row, end_row, start_col, end_col) if data: output_filepath = os.path.join(output_dir, filename) write_excel(output_filepath, sheet_name, data) # 示例用法 input_directory = 'C:/path/to/excel/input/' # 替换成你的输入目录 output_directory = 'C:/path/to/excel/output/' # 替换成你的输出目录 process_excel_files(input_directory, output_directory)
注意: 请替换代码中的'C:/path/to/excel/input/'和'C:/path/to/excel/output/'为你的实际输入和输出目录路径。 确保安装了openpyxl库 (pip install openpyxl)。 这个改进后的代码更加健壮,处理了文件不存在和读取错误等异常情况,并提高了效率。 通过read_only=True参数,load_workbook函数以只读模式打开文件,可以显著提升性能,尤其是在处理大量文件时。
以上就是如何使用Python循环读取多个Excel文件并分别将数据存入不同的表格?的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号