Python pandas通过read_excel和to_excel方法可高效读写Excel文件,需安装pandas与openpyxl等引擎;支持指定工作表、列、跳过行等参数,且能用ExcelWriter写入多表。

用 Python pandas 操作 Excel 文件非常方便,主要依赖 pandas 提供的 read_excel 和 to_excel 方法。只要安装好 pandas 和对应的引擎(如 openpyxl 或 xlrd),就能轻松读写 Excel 文件。
1. 安装依赖库
操作 Excel 需要安装 pandas 和支持 Excel 的引擎:
- openpyxl:用于读写 .xlsx 文件(推荐)
- xlrd:旧版,主要用于读取 .xls 文件(新版 pandas 对 .xls 支持有限)
安装命令:
pip install pandas openpyxl2. 读取 Excel 数据
pandas 使用 read_excel 函数加载 Excel 中的数据,默认读取第一个工作表:
立即学习“Python免费学习笔记(深入)”;
import pandas as pd# 读取整个表格
df = pd.read_excel('data.xlsx')
# 指定工作表名或索引
df = pd.read_excel('data.xlsx', sheet_name='Sheet1')
df = pd.read_excel('data.xlsx', sheet_name=0) # 第一个表
# 读取多个表
sheets = pd.read_excel('data.xlsx', sheet_name=['Sheet1', 'Sheet2'])
# 返回字典,键为表名,值为 DataFrame
常见参数:
一套面向小企业用户的企业网站程序!功能简单,操作简单。实现了小企业网站的很多实用的功能,如文章新闻模块、图片展示、产品列表以及小型的下载功能,还同时增加了邮件订阅等相应模块。公告,友情链接等这些通用功能本程序也同样都集成了!同时本程序引入了模块功能,只要在系统默认模板上创建模块,可以在任何一个语言环境(或任意风格)的适当位置进行使用!
- header:指定哪一行作为列名(默认 0)
- usecols:只读取某些列,如 usecols='A:C' 或 usecols=['name', 'age']
- skiprows:跳过前面几行
- na_values:自定义缺失值标识
3. 写入 Excel 文件
使用 to_excel 方法将 DataFrame 保存为 Excel:
df.to_excel('output.xlsx', index=False, sheet_name='Result')常用参数说明:
- index=False:不保存行索引
- sheet_name:指定工作表名称
- startrow / startcol:从指定行列开始写入
- engine='openpyxl':显式指定引擎(写入 .xlsx 必须)
如果要写入多个工作表,需使用 ExcelWriter:
with pd.ExcelWriter('output.xlsx', engine='openpyxl') as writer:df1.to_excel(writer, sheet_name='Data1', index=False)
df2.to_excel(writer, sheet_name='Data2', index=False)
4. 常见操作示例
实际使用中的一些典型场景:
# 过滤数据后写回df = pd.read_excel('sales.xlsx')
filtered = df[df['amount'] > 1000]
filtered.to_excel('high_sales.xlsx', index=False)
# 添加新列再保存
df['total'] = df['price'] * df['quantity']
df.to_excel('updated.xlsx', index=False)
基本上就这些。pandas 结合 openpyxl 能覆盖大多数 Excel 操作需求,适合做数据清洗、分析和批量处理。注意文件路径和格式问题,避免编码或引擎错误。










