PythonExcel数据统计分析_openpyxl与pandas结合案例【教学】

冷炫風刃
发布: 2025-12-23 22:53:32
原创
702人浏览过
openpyxl与pandas分工协作:pandas负责数据清洗计算,openpyxl负责格式化呈现;pandas读写会丢失样式,需用openpyxl操作模板、填入结果并设置格式、条件高亮等。

pythonexcel数据统计分析_openpyxl与pandas结合案例【教学】

用 Python 做 Excel 数据统计分析,openpyxl 负责精细格式控制和已有文件操作,pandas 负责高效清洗与计算——二者不是替代关系,而是分工协作。关键在于:先用 pandas 处理逻辑,再用 openpyxl 落地呈现。

一、为什么不能只用 pandas 读写 Excel?

pandas 的 read_excel()to_excel() 底层依赖 openpyxl(或 xlsxwriter)引擎,但它们会丢弃原工作表的样式、合并单元格、图表、批注等非数据信息。如果你要保留模板格式、自动适配列宽、加边框或高亮异常值,就必须切换到 openpyxl 手动操作。

  • ✅ pandas:适合读取原始数据 → 清洗 → 汇总 → 生成新表格
  • ✅ openpyxl:适合打开已有报表模板 → 填入 pandas 计算结果 → 设置字体/颜色/边框 → 保存为“可交付版”
  • ❌ 单用 pandas.to_excel():生成的是“干净但无格式”的表格,常被业务方退回重做

二、典型协作流程:销售报表自动化

假设你有一份《月度销售汇总.xlsx》模板,含固定标题、公司 logo 单元格、预设边框和“数据区”占位符(如 A10 开始)。真实数据来自数据库或 CSV,需填入并高亮超目标门店。

初阶PHP Apache MySQL网站设计
初阶PHP Apache MySQL网站设计

初阶PHP Apache MySQL网站设计来自作者多年学习、应用和讲授PHP的经验与体会,是专为学习PHP+MySQL数据库编程人员编与的入门教材。在最后二章设计了2个贴近实际应用的典型案例:留言本系统和论坛系统,每个案例先介绍开发思路、步骤,再给出全部源代码,使所学内容与实际应用紧密结合,特别是论坛系统将全书的案例串讲起来,力求使读者学到最贴近应用前沿的知识和技能。

初阶PHP Apache MySQL网站设计 389
查看详情 初阶PHP Apache MySQL网站设计

操作分三步:

立即学习Python免费学习笔记(深入)”;

  • 1. 用 pandas 加载并计算:读原始数据,按区域聚合销售额、计算完成率、标记达标状态
  • 2. 用 openpyxl 打开模板:定位“数据区”起始单元格(如 ws['A10']),逐行写入 pandas 的结果(注意:openpyxl 不支持直接写 DataFrame,需转成列表或循环赋值)
  • 3. 格式增强:对完成率列设置条件格式(如 >100% 填绿色)、自动调整列宽、冻结首行、保存为新文件

三、关键代码片段(不粘贴完整脚本,只讲核心)

▶ 写入数据(避免逐单元格 for 循环太慢)
ws.append() 批量追加一行行数据,比 ws.cell(row=..., column=...).value = ... 快得多:

# df_result 是 pandas 处理后的 DataFrame
for r in dataframe_to_rows(df_result, index=False, header=False):
  ws.append(r)

▶ 高亮达标行(openpyxl 条件格式示例)
不是靠 if 判断每行,而是用内置条件格式规则:

from openpyxl.formatting.rule import CellIsRule
rule = CellIsRule(operator='greaterThan', formula=['1'], stopIfTrue=True,
    fill=PatternFill(start_color='C6EFCE', end_color='C6EFCE', fill_type='solid'))
ws.conditional_formatting.add('E10:E100', rule) # 假设完成率在 E 列

四、避坑提醒

  • openpyxl 默认从 1 开始计数(row=1, column=1),pandas 的 .iloc[] 从 0 开始——写入前注意索引偏移
  • 写入数字时,openpyxl 可能自动识别为字符串(尤其带逗号或百分号),建议显式转类型:float(val)int(val)
  • 如果模板含公式(如 =SUM(B10:B20)),openpyxl 不会重算——要么用 workbook.data_only = True 读取已计算值,要么写入后用 Excel 手动刷新
  • 中文路径/文件名务必用 UTF-8 编码打开,否则报错 UnicodeDecodeError

以上就是PythonExcel数据统计分析_openpyxl与pandas结合案例【教学】的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号