0

0

c++中如何解析xml文件_c++读取与处理xml数据方法

穿越時空

穿越時空

发布时间:2026-01-06 16:03:46

|

476人浏览过

|

来源于php中文网

原创

推荐tinyxml2:轻量、头文件即用、无依赖、全平台支持;需检查LoadFile()返回值,用FirstChildElement()替代RootElement(),GetText()前判空并手动trim,遍历用for循环,SaveFile()需SetIndent()格式化。

c++中如何解析xml文件_c++读取与处理xml数据方法

用 tinyxml2 读取 XML 文件最省事

直接上手推荐 tinyxml2,轻量、头文件即用、无依赖,比 libxml2 简单太多,也比 pugixml 更少隐式行为。Windows/Linux/macOS 全平台支持,C++11 起就能用。

常见错误:忘记检查 LoadFile() 返回值,导致后续调用 FirstChildElement() 崩溃;或误把 XMLDocument::RootElement() 返回的 nullptr 当有效节点用。

  • 下载 tinyxml2.htinyxml2.cpp,加到工程里(或用 vcpkg:vcpkg install tinyxml2
  • 确保 XML 文件编码是 UTF-8(含 BOM 会报错 XML_ERROR_PARSING_TEXT
  • 始终检查 doc.LoadFile("config.xml") == tinyxml2::XML_SUCCESS
  • doc.FirstChildElement("root") 替代 doc.RootElement(),避免空文档时返回空指针再解引用

提取元素文本内容要防空指针和空白符

XMLElement::GetText() 返回的是裸指针,可能为 nullptr;且默认不 trim 空格换行——XML 中换行缩进会被当作文本节点的一部分。

典型场景:读取 Alice ,直接用 elem->GetText() 会得到 " Alice ",甚至更糟:如果中间有换行,实际拿到的是 "\n Alice\n"

立即学习C++免费学习笔记(深入)”;

  • 先判空:if (auto text = elem->GetText()) { /* 处理 */ }
  • 手动 trim:用 std::string_view + find_first_not_of() / find_last_not_of(),别依赖 std::string::erase() 原地改
  • 若需递归合并所有子文本(如含 CDATA 或混合节点),改用 elem->FirstChild()->Value() 并遍历 NextSibling(),但多数配置类 XML 不需要这么复杂

遍历同名子元素别用 while(true) + NextSiblingElement()

写成 while (child = parent->FirstChildElement("item")) { ... child = child->NextSiblingElement("item"); } 是错的——第一次就卡死在第一个节点,永远循环。

正确模式是“先取首节点,再在循环体内跳转”,否则逻辑错位,调试时容易漏掉最后一个元素或无限循环。

for (auto* item = root->FirstChildElement("item"); 
     item != nullptr; 
     item = item->NextSiblingElement("item")) {
    const char* id = item->Attribute("id");
    const char* value = item->GetText();
    // 处理每个 item
}
  • for 循环比 while 更清晰,初始化、条件、迭代三部分一目了然
  • 传入 NextSiblingElement("item") 参数可跳过非目标标签,比如中间夹着 也不影响
  • 若 XML 结构不确定(可能无 item),FirstChildElement() 返回 nullptr 时循环直接不执行,安全

修改 XML 后保存要注意编码和格式化

XMLDocument::SaveFile() 默认输出无缩进、无换行的紧凑格式,且强制 UTF-8 编码——Windows 记事本打不开(显示乱码),部分旧系统工具也不认。

更麻烦的是:如果原始 XML 有注释或 CDATA,tinyxml2 解析后保存会丢失它们(它不保留非结构信息)。

  • 启用格式化:调用 doc.SetIndent(" ") 再保存,缩进才好看
  • UTF-8 with BOM?tinyxml2 不支持写 BOM,得自己用二进制方式在文件头插入 0xEF 0xBB 0xBF
  • 要保留注释?换 pugixml,它提供 preserve_comments 选项;但代价是 API 更冗长、内存占用略高
  • 生产环境写 XML 配置,建议只读不写;真要生成,优先考虑 JSON/YAML,XML 的写入生态太弱

真正难的不是解析语法,而是处理现实 XML:命名空间、实体引用、DTD 声明、混合内容——这些 tinyxml2 全都不支持。一旦遇到,要么预处理清洗,要么换重型库。别在项目中期才发现 XML 里藏着

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

406

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

531

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

308

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

74

2025.09.10

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

314

2023.08.02

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

719

2023.08.22

while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

83

2023.09.25

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1860

2024.04.01

PPT动态图表制作教程大全
PPT动态图表制作教程大全

本专题整合了PPT动态图表制作相关教程,阅读专题下面的文章了解更多详细内容。

13

2026.01.07

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 6.7万人学习

Git 教程
Git 教程

共21课时 | 2.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号