Pandas通过read_excel和to_excel方法实现Excel读写,需安装pandas、openpyxl等库;可指定工作表、跳过行、解析日期,支持多表读取与写入,结合DataFrame操作完成数据处理。

使用Pandas处理Excel文件非常方便,主要依赖于pandas.read_excel()和df.to_excel()两个核心方法。只要安装好相关库,就能轻松读取和写入Excel数据。
安装与环境准备
Pandas本身不直接支持Excel格式,需要额外安装引擎:
- 安装pandas:pip install pandas
- 读取.xlsx文件需要openpyxl:pip install openpyxl
- 如果要读写旧版.xls文件,可安装xlrd:pip install xlrd
确保版本兼容,尤其是处理xlsx文件时,推荐使用较新版本的openpyxl。
读取Excel文件
使用pd.read_excel()可以将Excel数据加载为DataFrame:
- 基础用法:df = pd.read_excel("data.xlsx") —— 默认读取第一个工作表
- 指定工作表:pd.read_excel("data.xlsx", sheet_name="Sheet2")
- 通过索引选表:pd.read_excel("data.xlsx", sheet_name=0)
- 读多个表:pd.read_excel("data.xlsx", sheet_name=["Sheet1", "Sheet2"]) 返回字典
- 跳过行或设置列名:pd.read_excel("data.xlsx", skiprows=2, usecols="A:D")
注意:如果第一行不是标题,可以设置header=None,让Pandas自动生成列名。
处理数据
读入数据后,就可以用Pandas进行各种操作:
- 查看前几行:df.head()
- 检查数据类型:df.dtypes
- 处理缺失值:df.dropna() 或 df.fillna(0)
- 筛选数据:df[df["销售额"] > 1000]
- 添加新列:df["利润率"] = df["利润"] / df["销售额"]
Excel中常见的日期列,Pandas可通过parse_dates参数自动识别:
pd.read_excel("data.xlsx", parse_dates=["日期"])
写入Excel文件
处理完数据后,可以用to_excel()保存结果:
- 基本保存:df.to_excel("output.xlsx", index=False) —— 建议关闭index避免多余列
- 写入特定工作表:df.to_excel("output.xlsx", sheet_name="处理结果", index=False)
- 多个表写入一个文件:
需使用pd.ExcelWriter:
df1.to_excel(writer, sheet_name="汇总", index=False)
df2.to_excel(writer, sheet_name="明细", index=False)
基本上就这些。读、处理、写三步走,配合openpyxl等引擎,Pandas能高效完成大多数Excel数据任务。关键是熟悉参数,避免格式错乱或数据丢失。










