使用python高效拆分大型excel文件
本文介绍如何利用Python将大型Excel表格拆分成多个较小的文件,避免单一文件过大导致处理效率低下。以下步骤以一个包含1000行数据的Excel表格为例,将其拆分成10个100行的小表格。
步骤详解:
导入必要的库和加载主表格:
立即学习“Python免费学习笔记(深入)”;
from openpyxl import load_workbook wb = load_workbook("path/to/总表格.xlsx") # 请替换为您的文件路径 ws = wb.active # 获取活动工作表
提取并组织数据: 这段代码优化的重点在于避免了不必要的locals()使用,直接使用列表存储数据,提高效率。
total_data = [] for row in ws.iter_rows(min_row=3, values_only=True): # 从第三行开始读取,values_only提高效率 total_data.append(list(row))
创建并保存小文件: 这段代码利用了列表切片,更加简洁高效地处理数据分块。
rows_per_file = 100 template_wb = load_workbook("path/to/模板.xlsx") # 请替换为您的模板文件路径 template_ws = template_wb.active for i in range(0, len(total_data), rows_per_file): new_wb = template_wb.copy_workbook() new_ws = new_wb.active new_ws.title = f"Sheet{i // rows_per_file + 1}" # 文件名 for j, row_data in enumerate(total_data[i:i + rows_per_file]): for k, cell_value in enumerate(row_data): new_ws.cell(row=j + 1, column=k + 1).value = cell_value new_wb.save(f"path/to/完成数据_{i // rows_per_file + 1}.xlsx") # 请替换为您的保存路径
通过以上步骤,您可以将大型Excel文件高效地拆分成多个较小的文件,方便后续处理和分析。 请记得替换代码中的文件路径为您的实际路径。 此方法避免了原代码中不必要的字典操作和循环嵌套,显著提高了代码效率和可读性。
以上就是如何用Python将大型Excel表格拆分成多个小文件?的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号