0

0

使用Python将文本文件中的数值数据高效写入Excel并确保数据类型正确

碧海醫心

碧海醫心

发布时间:2025-09-01 16:15:12

|

206人浏览过

|

来源于php中文网

原创

使用python将文本文件中的数值数据高效写入excel并确保数据类型正确

本教程详细介绍了如何使用Python读取TXT文件中的数据,将其转换为适当的整数类型,并写入Excel文件。核心内容包括利用openpyxl库处理Excel,通过条件判断isdigit()在数据写入阶段确保数值类型正确性,以及计算并添加平均值列,最终生成结构清晰、数据类型准确的Excel报告。

在数据处理和报告生成的场景中,我们经常需要将原始文本数据导入到更结构化的格式,如Excel,以便于进一步分析和展示。本教程将引导您完成一个典型的任务:从TXT文件中读取学生成绩数据,将其写入Excel表格,并确保所有数值数据都被正确识别为整数类型,同时计算每行成绩的平均值。

1. 环境准备与库安装

要处理Excel文件,我们需要使用openpyxl库。如果您尚未安装,可以通过以下命令进行安装:

pip install openpyxl

2. 准备源数据文件

假设我们有一个名为AI.txt的文本文件,其中包含学生的分数数据。文件内容示例如下(每行代表一个学生的两次考试成绩):

Student1 85 90
Student2 78 88
Student3 92 95
Student4 60 70
Student5 80 85
Student6 75 82

请注意,实际文件可能只包含数字,或者像示例一样包含非数字的标识符(如学生姓名)。本教程将展示如何灵活处理这两种情况。

立即学习Python免费学习笔记(深入)”;

3. Python程序实现

以下是实现上述功能的完整Python程序代码:

import openpyxl

def process_scores_to_excel(txt_file_path, excel_file_path, sheet_name="qq"):
    """
    读取TXT文件中的学生成绩数据,将其转换为整数类型并写入Excel文件,
    同时计算并添加平均值列。

    Args:
        txt_file_path (str): 输入的TXT文件路径。
        excel_file_path (str): 输出的Excel文件路径。
        sheet_name (str): Excel工作表的名称。
    """
    try:
        # 1. 读取TXT文件内容
        with open(txt_file_path, 'r', encoding='utf-8') as file:
            lines = file.readlines()

        # 2. 创建一个新的Excel工作簿和工作表
        workbook = openpyxl.Workbook()
        # 创建一个名为 'qq' 的工作表,并将其设置为第一个工作表
        sheet = workbook.create_sheet(index=0, title=sheet_name)

        # 3. 逐行处理数据并写入Excel
        # 假设第一行可能是标题,但原始数据没有明确标题,我们直接处理数据
        # 如果TXT文件有标题行,需要额外处理

        # 添加一个示例标题行(可选,根据实际需求调整)
        sheet.append(["Student ID", "Exam 1 Score", "Exam 2 Score"]) 

        for line in lines:
            # 移除行首尾空白字符,并按空格分割成列表
            cur_data = line.strip().split()

            # 使用列表推导式进行条件转换:
            # 如果元素是数字,则转换为整数;否则保留原始字符串。
            # 这种方式确保了即使TXT文件中包含非数字(如学生姓名),也能正确处理。
            processed_row = [int(item) if item.isdigit() else item for item in cur_data]

            # 将处理后的行数据追加到Excel工作表
            sheet.append(processed_row)

        # 4. 计算并添加平均值列
        # 首先为平均值列添加标题
        # 假设数据从第2行开始(第1行是标题),数据有3列(ID, Exam1, Exam2)
        # 平均值将添加到第4列
        sheet.cell(row=1, column=4, value="Mean Score")

        # 遍历从第2行开始的所有数据行,计算平均值
        # max_col 需要根据实际数据列数调整。
        # 如果数据只有两列分数,max_col=3(ID, Score1, Score2),平均值在第4列
        # 如果数据没有ID,只有两列分数,max_col=2,平均值在第3列
        # 这里假设数据是 "ID Score1 Score2",所以数据列是3列,平均值在第4列
        for row_index in range(2, sheet.max_row + 1): # 从第二行开始遍历
            # 获取当前行中所有单元格的值
            current_row_values = [sheet.cell(row=row_index, column=col).value 
                                  for col in range(2, sheet.max_column + 1)] # 从第二列开始获取数值

            # 筛选出数值类型(整数或浮点数)进行平均值计算
            numeric_values = [val for val in current_row_values if isinstance(val, (int, float))]

            if numeric_values: # 确保有数值可供计算
                avg_value = sum(numeric_values) / len(numeric_values)
                # 将平均值写入到当前行的第四列
                sheet.cell(row=row_index, column=4, value=avg_value)
            else:
                sheet.cell(row=row_index, column=4, value="N/A") # 如果没有数值,则显示N/A

        # 5. 保存Excel文件
        workbook.save(excel_file_path)
        print(f"数据已成功写入 '{excel_file_path}'。")

    except FileNotFoundError:
        print(f"错误:文件 '{txt_file_path}' 未找到。")
    except Exception as e:
        print(f"发生错误:{e}")

# 调用函数执行程序
if __name__ == "__main__":
    txt_file = 'AI.txt'
    excel_file = 'AI56.xlsx'
    process_scores_to_excel(txt_file, excel_file)

4. 关键代码解析与注意事项

  1. 读取TXT文件:

    with open(txt_file_path, 'r', encoding='utf-8') as file:
        lines = file.readlines()

    使用with语句确保文件被正确关闭。readlines()将文件所有行读取到一个列表中。encoding='utf-8'是处理多种字符编码的良好实践。

  2. 创建Excel工作簿和工作表:

    青鸟酒店管理系统源码
    青鸟酒店管理系统源码

    一套酒店管理系统,方便了酒店管理,提高酒店工作效率、信息的准确性基本设置 客房管理 查看客房信息 新增客房信息 客房类型管理 查看客房类型信息 新增客房类型信息 客房状态管理业务管理 入住 退房注销数据库在DB_51aspx 文件夹中,附加即可用户名和密码是:51aspx【该源码由51aspx提供】

    下载
    workbook = openpyxl.Workbook()
    sheet = workbook.create_sheet(index=0, title=sheet_name)

    openpyxl.Workbook()创建一个新的Excel文件。create_sheet(index=0, title='qq')创建名为"qq"的工作表并将其置于第一个位置。

  3. 数据类型转换的核心:

    processed_row = [int(item) if item.isdigit() else item for item in cur_data]
    sheet.append(processed_row)

    这是解决原始问题(Excel中数值仍显示为文本)的关键。

    • line.strip().split():清理每行数据,将其分割成字符串列表。
    • [int(item) if item.isdigit() else item for item in cur_data]:这是一个列表推导式,它遍历cur_data中的每个元素item。
      • item.isdigit():检查item是否只包含数字字符。这个方法对于判断字符串是否可以安全地转换为整数非常有效。
      • 如果item.isdigit()为真,则将其转换为整数int(item)。
      • 否则(例如,如果item是学生姓名或包含非数字字符),则保留其原始字符串形式item。
    • sheet.append(processed_row):openpyxl在append列表时,会自动根据Python的数据类型识别并写入Excel。通过这种预处理,int类型的数值会直接作为Excel的数字类型写入,而不是文本。
  4. 计算平均值:

    # 添加平均值列标题
    sheet.cell(row=1, column=4, value="Mean Score")
    
    for row_index in range(2, sheet.max_row + 1):
        current_row_values = [sheet.cell(row=row_index, column=col).value 
                              for col in range(2, sheet.max_column + 1)] # 假设数据从第2列开始
        numeric_values = [val for val in current_row_values if isinstance(val, (int, float))]
        if numeric_values:
            avg_value = sum(numeric_values) / len(numeric_values)
            sheet.cell(row=row_index, column=4, value=avg_value)
    • sheet.cell(row=R, column=C, value=V)用于向指定单元格写入值。
    • sheet.max_row和sheet.max_column获取当前工作表的最大行号和列号。
    • isinstance(val, (int, float)):在计算平均值之前,我们再次筛选确保只对数值类型(整数或浮点数)进行计算,避免因非数值数据导致错误。
  5. 保存Excel文件:

    workbook.save(excel_file_path)

    将修改后的工作簿保存到指定的文件路径。

5. 总结

通过本教程,您学会了如何使用Python和openpyxl库将文本文件中的数据导入到Excel,并解决了数据类型转换的关键问题。核心在于在将数据追加到Excel之前,利用isdigit()方法对每个数据项进行条件判断和类型转换。这种方法确保了Excel文件中的数值数据能够被正确识别和处理,为后续的数据分析奠定了坚实基础。同时,我们也学习了如何计算并添加新的派生列(如平均值),使生成的Excel报告更加完整和有用。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

716

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

626

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

739

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

617

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1236

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

575

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

699

2023.08.11

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

7

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Excel 教程
Excel 教程

共162课时 | 10.2万人学习

成为PHP架构师-自制PHP框架
成为PHP架构师-自制PHP框架

共28课时 | 2.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号