最实用的组合是openpyxl负责样式、公式、合并单元格等排版,pandas专注数据清洗与分析;读取需data_only=True获取公式结果,写入须单元格级赋值以保留格式,新增sheet用openpyxl创建并逐行写入。

用 openpyxl 读写 Excel 格式细节(如样式、公式、合并单元格),再用 pandas 做数据清洗和分析,是最实用的组合方案。关键在于分工明确:pandas 负责“算”,openpyxl 负责“排版”。
openpyxl 默认不解析公式值,只读原始公式字符串;若要读计算结果,需启用 data_only=True。同时注意:它不自动跳过空行或识别表头,需手动指定范围。
load_workbook(filename, data_only=True) 打开文件,避免公式显示为 =SUM(A1:A10) 而不是实际数值ws.iter_rows(min_row=2, max_row=100, values_only=True) 按行提取数据,values_only=True 返回纯值(忽略样式)pd.DataFrame(),并用第一行作列名:df = pd.DataFrame(data[1:], columns=data[0])
直接用 df.to_excel() 会清空原有样式、公式和批注。正确做法是:用 openpyxl 定位目标区域,逐单元格赋值,其他格式不动。
load_workbook(filename, keep_vba=True, read_only=False) 打开(keep_vba 可选,若含宏)ws = wb['Sheet1'],再确定起始单元格,如 start_cell = ws['C5']
for r_idx, row in enumerate(df.values, 1):,再嵌套列循环:for c_idx, value in enumerate(row, 1):,写入 ws.cell(row=start_cell.row + r_idx, column=start_cell.column + c_idx - 1, value=value)
适合生成报表时追加分析页,不影响原表结构和样式。
立即学习“Python免费学习笔记(深入)”;
wb.create_sheet(title='Analysis_2024') 新建 sheetdataframe_to_rows(df, index=False, header=True) 将 DataFrame 转为可迭代行数据for r_idx, row in enumerate(rows, 1):,再 for c_idx, value in enumerate(row, 1):,最后 ws.cell(r_idx, c_idx, value)
for col in ['A', 'B', 'C']: ws.column_dimensions[col].width = 12
openpyxl 对合并单元格敏感——读取时只有左上角单元格有值,其余为 None;写入时若覆盖已合并区域,会自动取消合并。需提前检查。
for merged_cell in ws.merged_cells.ranges:,记录范围,后续逻辑跳过非首单元格ws.unmerge_cells('A1:C1'),写完再重新合并(如有必要)ws.cell(...).value 写值后,对对应区域调用 ws.merge_cells('A1:C1')
不复杂但容易忽略。核心就三点:读用 data_only,写用单元格级赋值,增删 sheet 用 openpyxl 管理结构,pandas 只管数据流。
以上就是PythonExcel文件操作_openpyxl与pandas结合实例【教程】的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号