0

0

怎样在C++中解析CSV文件_CSV解析方法及代码示例

尼克

尼克

发布时间:2025-07-04 08:08:02

|

343人浏览过

|

来源于php中文网

原创

解析csv文件的方法有基础实现和高级库两种方式。1.基础方法使用std::ifstream读取文件,std::getline按行分割,再用std::stringstream处理每行的逗号分隔,适用于简单无引号转义的文件但需手动处理复杂情况;2.高级方法使用rapidcsv、boost.csv等库,自动处理引号、转义字符及编码问题,提升开发效率与稳定性;3.针对编码问题,可在代码中设置locale指定utf-8或转换文件为ansi编码;4.处理引号和转义字符可扩展手动解析逻辑或直接依赖现成库;5.性能优化方面,对大规模文件可采用内存映射、多线程解析、simd指令加速及减少内存分配等方式提升效率。

怎样在C++中解析CSV文件_CSV解析方法及代码示例

解析CSV文件,简单来说就是把逗号分隔的数据提取出来,变成程序能用的数据结构。方法很多,关键看你的CSV文件有多复杂,性能要求有多高。

怎样在C++中解析CSV文件_CSV解析方法及代码示例

解决方案

怎样在C++中解析CSV文件_CSV解析方法及代码示例

最基础的方法就是用std::ifstream读取文件,然后用std::getline按行读取,再用std::stringstreamstd::getline按逗号分割每一行。这种方法简单直接,但需要自己处理引号、转义字符等复杂情况。

立即学习C++免费学习笔记(深入)”;

#include 
#include 
#include 
#include 
#include 

std::vector> parseCSV(const std::string& filename) {
    std::vector> data;
    std::ifstream file(filename);
    std::string line;

    while (std::getline(file, line)) {
        std::stringstream lineStream(line);
        std::string cell;
        std::vector row;

        while (std::getline(lineStream, cell, ',')) {
            row.push_back(cell);
        }
        data.push_back(row);
    }
    return data;
}

int main() {
    std::vector> csvData = parseCSV("example.csv");
    for (const auto& row : csvData) {
        for (const auto& cell : row) {
            std::cout << cell << " ";
        }
        std::cout << std::endl;
    }
    return 0;
}

这段代码是最基础的实现,没有处理引号和转义字符。如果你的CSV文件比较干净,可以用这个。

怎样在C++中解析CSV文件_CSV解析方法及代码示例

更高级的方法是使用现成的CSV解析库,比如RapidCSVBoost.CSV等等。这些库通常已经处理了各种复杂的CSV格式,用起来更方便,也更可靠。

比如使用RapidCSV:

#include "rapidcsv.h"
#include 

int main() {
    rapidcsv::Document doc("example.csv");
    std::cout << "Read " << doc.GetRowCount() << " rows and " << doc.GetColumnCount() << " columns.\n";

    // 访问数据示例
    std::cout << "Value at (row=0, col=0): " << doc.GetCell(0, 0) << std::endl;
    return 0;
}

使用库的好处是减少了自己处理复杂情况的工作量,但是也增加了程序的依赖。

CSV文件编码问题导致解析错误怎么办?

CSV文件常见的编码问题是UTF-8和ANSI。如果你的程序默认使用ANSI编码,而CSV文件是UTF-8编码,那么中文等字符就会显示乱码。

解决方法是:

  1. 确定CSV文件的编码: 可以用文本编辑器打开CSV文件,查看文件的编码格式。

    X Detector
    X Detector

    最值得信赖的多语言 AI 内容检测器

    下载
  2. 在代码中指定编码: 如果确定CSV文件是UTF-8编码,可以在读取文件之前设置locale。

    #include 
    #include 
    
    // ...
    std::locale utf8_locale(std::locale(), new std::codecvt_utf8);
    file.imbue(utf8_locale); // 设置文件流的locale
    // ...

    需要注意的是,std::codecvt_utf8 在C++17中已经被标记为deprecated,在C++20中被移除。如果你的编译器不支持,可以考虑使用第三方库,或者自己实现UTF-8和ANSI之间的转换。

  3. 转换CSV文件编码: 也可以用文本编辑器将CSV文件转换为ANSI编码,这样程序就可以直接读取了。但是这种方法可能会导致数据丢失,特别是如果CSV文件中包含Unicode字符。

如何处理CSV文件中包含引号和转义字符的情况?

CSV文件中,引号通常用于包含包含逗号的字段,转义字符用于表示引号本身。处理这些情况需要一些额外的逻辑。

  1. 手动解析: 在手动解析CSV文件时,需要判断当前字符是否在引号内,如果是,则需要跳过逗号。如果遇到转义字符,需要将其替换为对应的字符。

    std::vector splitCSVLine(const std::string& line) {
        std::vector result;
        std::string currentField;
        bool inQuotes = false;
    
        for (char c : line) {
            if (c == '"') {
                inQuotes = !inQuotes;
            } else if (c == ',' && !inQuotes) {
                result.push_back(currentField);
                currentField.clear();
            } else {
                currentField += c;
            }
        }
        result.push_back(currentField);
        return result;
    }

    这个例子只处理了简单的引号情况,没有处理转义字符。更完整的实现需要考虑更多细节。

  2. 使用CSV解析库:RapidCSVBoost.CSV这样的库通常已经处理了引号和转义字符,可以直接使用。使用库的好处是减少了自己处理复杂情况的工作量,但是也增加了程序的依赖。

性能优化:大规模CSV文件如何高效解析?

如果CSV文件非常大,那么解析速度就会成为一个问题。可以考虑以下优化方法:

  1. 使用内存映射文件: 将CSV文件映射到内存中,可以减少磁盘I/O,提高读取速度。
  2. 多线程解析: 将CSV文件分割成多个部分,用多个线程同时解析,可以提高解析速度。
  3. 使用SIMD指令: 使用SIMD指令可以同时处理多个字符,提高解析速度。
  4. 减少内存分配: 在解析CSV文件时,尽量避免频繁的内存分配,可以使用预分配的缓冲区。
  5. 选择合适的CSV解析库: 不同的CSV解析库性能不同,选择性能较好的库可以提高解析速度。

选择哪种优化方法取决于CSV文件的大小、硬件资源和性能要求。通常情况下,使用内存映射文件和多线程解析可以显著提高解析速度。

相关专题

更多
treenode的用法
treenode的用法

​在计算机编程领域,TreeNode是一种常见的数据结构,通常用于构建树形结构。在不同的编程语言中,TreeNode可能有不同的实现方式和用法,通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

534

2023.12.01

C++ 高效算法与数据结构
C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化,涵盖排序算法(快速排序、归并排序)、查找算法、图算法、动态规划、贪心算法等,并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构(链表、树、堆、哈希表等),帮助开发者提升 在复杂应用中的算法设计与性能优化能力。

17

2025.12.22

深入理解算法:高效算法与数据结构专题
深入理解算法:高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念,适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用,如数组、链表、栈、队列、哈希表、树、图等;以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析,帮助开发者不仅能熟练运用这些基础知识,还能在实际编程中优化性能,提高代码的执行效率。本专题适合准备面试的开发者,也适合希望提高算法思维的编程爱好者。

13

2026.01.06

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

480

2023.08.10

Python 多线程与异步编程实战
Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧,包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例,帮助学习者掌握 如何构建高性能、多任务并发的 Python 应用。

143

2025.12.24

PHP 高并发与性能优化
PHP 高并发与性能优化

本专题聚焦 PHP 在高并发场景下的性能优化与系统调优,内容涵盖 Nginx 与 PHP-FPM 优化、Opcode 缓存、Redis/Memcached 应用、异步任务队列、数据库优化、代码性能分析与瓶颈排查。通过实战案例(如高并发接口优化、缓存系统设计、秒杀活动实现),帮助学习者掌握 构建高性能PHP后端系统的核心能力。

98

2025.10.16

PHP 数据库操作与性能优化
PHP 数据库操作与性能优化

本专题聚焦于PHP在数据库开发中的核心应用,详细讲解PDO与MySQLi的使用方法、预处理语句、事务控制与安全防注入策略。同时深入分析SQL查询优化、索引设计、慢查询排查等性能提升手段。通过实战案例帮助开发者构建高效、安全、可扩展的PHP数据库应用系统。

72

2025.11.13

JavaScript 性能优化与前端调优
JavaScript 性能优化与前端调优

本专题系统讲解 JavaScript 性能优化的核心技术,涵盖页面加载优化、异步编程、内存管理、事件代理、代码分割、懒加载、浏览器缓存机制等。通过多个实际项目示例,帮助开发者掌握 如何通过前端调优提升网站性能,减少加载时间,提高用户体验与页面响应速度。

25

2025.12.30

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

36

2026.01.14

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 6.7万人学习

C 教程
C 教程

共75课时 | 4万人学习

C++教程
C++教程

共115课时 | 12.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号