pandas库的pd.read_excel()函数可轻松读取Excel文件,支持指定工作表、跳过行、选择列等操作,通过sheet_name参数可读取单个或多个工作表,返回DataFrame或字典,便于灵活处理复杂数据。

用Python处理Excel文件,
pandas
pd.read_excel()
解决方案: 说起来,用pandas读取Excel文件,最基础也是最核心的就是
pd.read_excel()
比如,你有一个叫
data.xlsx
import pandas as pd
# 最简单的读取方式
df = pd.read_excel('data.xlsx')
print(df.head())但真实世界里的Excel文件,往往不会那么“听话”。我个人觉得,
pd.read_excel()
指定工作表 (sheet_name
立即学习“Python免费学习笔记(深入)”;
# 读取名为 'Sheet2' 的工作表
df_sheet2 = pd.read_excel('data.xlsx', sheet_name='Sheet2')
# 读取索引为 1 的工作表(从0开始计数,即第二个工作表)
df_sheet_idx1 = pd.read_excel('data.xlsx', sheet_name=1)指定表头 (header
# 假设表头在第3行(索引为2)
df_header_row2 = pd.read_excel('data.xlsx', header=2)跳过行 (skiprows
# 跳过前5行
df_skip_rows = pd.read_excel('data.xlsx', skiprows=5)指定列 (usecols
# 读取 '姓名' 和 '年龄' 列
df_specific_cols = pd.read_excel('data.xlsx', usecols=['姓名', '年龄'])
# 也可以用列索引(0, 1, 2...)
df_specific_cols_idx = pd.read_excel('data.xlsx', usecols=[0, 2])自定义列名 (names
# 假设没有表头,给列命名
df_custom_names = pd.read_excel('data.xlsx', header=None, names=['ID', '产品', '价格'])指定数据类型 (dtype
# 强制 'ID' 列为字符串类型
df_with_dtype = pd.read_excel('data.xlsx', dtype={'ID': str, '价格': float})处理缺失值 (na_values
# 将 'N/A' 和 '-' 识别为缺失值
df_na_values = pd.read_excel('data.xlsx', na_values=['N/A', '-'])这些参数的灵活组合,基本上能让你应对绝大多数Excel读取的场景。我的经验是,多看官方文档,然后多尝试,很快就能上手。
这个问题问得特别好,因为一个Excel文件往往不止一个工作表。说实话,我刚开始用的时候,也经常遇到不知道怎么指定特定工作表的情况,或者想把所有工作表都读出来。
pd.read_excel()
sheet_name
读取单个工作表:
# 假设Excel里有叫 '销售数据' 的工作表
df_sales = pd.read_excel('my_report.xlsx', sheet_name='销售数据')
print("读取 '销售数据' 工作表的前几行:")
print(df_sales.head())# 读取第二个工作表(索引为1)
df_second_sheet = pd.read_excel('my_report.xlsx', sheet_name=1)
print("\n读取第二个工作表的前几行:")
print(df_second_sheet.head())读取多个工作表:
读取所有工作表: 这是我个人觉得非常实用的一个功能。当你把
sheet_name
None
pd.read_excel()
# 读取所有工作表
all_sheets_dict = pd.read_excel('my_report.xlsx', sheet_name=None)
print("\n读取所有工作表,结果是一个字典:")
for sheet_name, df in all_sheets_dict.items():
print(f"--- 工作表: {sheet_name} ---")
print(df.head(2)) # 只打印前两行,避免输出过多拿到这个字典后,你就可以通过工作表名称来访问每个DataFrame了,比如
all_sheets_dict['销售数据']
读取指定的部分工作表: 如果你只想读取几个特定的工作表,可以传入一个工作表名称的列表。
# 只读取 '销售数据' 和 '库存清单' 这两个工作表
selected_sheets_dict = pd.read_excel('my_report.xlsx', sheet_name=['销售数据', '库存清单'])
print("\n读取指定工作表,结果也是一个字典:")
for sheet_name, df in selected_sheets_dict.items():
print以上就是python怎么使用pandas读取Excel文件_pandas读取Excel文件教程的详细内容,更多请关注php中文网其它相关文章!
python怎么学习?python怎么入门?python在哪学?python怎么学才快?不用担心,这里为大家提供了python速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号