
在使用 pandas 和 glob 导入 excel 文件时的不常见的引擎指定难题
通过 pandas 库和 glob 模块读取 excel 文件时,早期阶段可能出现“excel 文件格式无法确定,您必须手动指定引擎”的错误信息。这个特殊错误的根源在于隐藏的临时文件 ~$filename.xlsx,当 ms excel 打开 xlsx 文件时会在同一目录中创建。
为了解决这个问题,有两个可行的解决方案:
为了避免此问题,在从文件夹中读取 excel 文件之前,确保关闭所有打开的 excel 文件并删除任何隐藏的临时文件 ~$filename.xlsx。通过遵循这些步骤,可以确保 pandas 和 glob 的无错误导入。
更新的代码:
# 以字符串形式指定引擎
df = pd.read_excel(f, engine="openpyxl").reindex(columns=customer_id).dropna(how='all', axis=1)
# 如果出现 BadZipFile 错误,则使用 xlrd
try:
    df = pd.read_excel(f, engine="openpyxl").reindex(columns=customer_id).dropna(how='all', axis=1)
except BadZipFile:
    df = pd.read_excel(f, engine="xlrd").reindex(columns=customer_id).dropna(how='all', axis=1)以上就是使用 Pandas 和 glob 导入 Excel 文件时如何解决“Excel 文件格式无法确定”错误?的详细内容,更多请关注php中文网其它相关文章!
                        
                        每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
                Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号