quick-xml是Rust中解析XML最常用、性能最佳且文档最全的库,支持流式(Reader)和serde反序列化两种方式;需在Cargo.toml中添加quick-xml = { version = "0.35", features = ["encoding"] }以支持非UTF-8编码。

用 Rust 解析 XML,quick-xml 是目前最常用、性能最好、文档较全的库。它支持流式(Reader)和树状(events + BytesStart 等)两种解析方式,兼顾内存效率和开发便利性。
在 Cargo.toml 中添加:
[dependencies]
quick-xml = { version = "0.35", features = ["encoding"] }注意:加 features = ["encoding"] 才能正确处理 UTF-8 以外的编码(如 GBK,不过实际中建议 XML 文件统一用 UTF-8)。
适合大文件或只需提取部分字段的场景,不加载整个 XML 到内存。
示例 XML(book.xml):
<library>
<book id="1">
<title>Rust编程入门</title>
<author>张三</author>
</book>
<book id="2">
<title>XML精讲</title>
<author>李四</author>
</book>
</library>用 Reader 逐事件解析:
use quick_xml::events::BytesStart;
use quick_xml::Reader;
fn main() -> Result<(), Box<std::error::Error>> {
let xml = r#"
<library>
<book id="1">
<title>Rust编程入门</title>
<author>张三</author>
</book>
</library>"#;
let mut reader = Reader::from_reader(xml.as_bytes());
reader.trim_text(true); // 自动忽略纯空白文本节点
let mut buf = Vec::new();
let mut books = Vec::new();
loop {
match reader.read_event_into(&mut buf) {
Ok(quick_xml::events::BytesEvent::Start(e)) => {
if e.name().as_ref() == b"book" {
let id = e.attributes()
.find(|a| a.key.as_ref() == b"id")
.map(|a| std::str::from_utf8(&a.value).unwrap_or("").to_string());
books.push((id, String::new(), String::new()));
}
}
Ok(quick_xml::events::BytesEvent::Text(e)) => {
let text = e.unescape_and_decode(&reader)?; // 安全解码实体(& → &)
if let Some(last) = books.last_mut() {
// 简单逻辑:紧接在 title/author 开始标签后的文本即为内容
// 实际中建议用状态机或栈记录当前路径
}
}
Ok(quick_xml::events::BytesEvent::Eof) => break,
Err(e) => return Err(e.into()),
_ => {}
}
buf.clear();
}
Ok(())
}⚠️ 流式解析需手动维护上下文(比如当前在哪个标签内),适合结构简单或性能敏感场景。
不用自己写状态机,借助 BytesStart、BytesText 和 Reader::read_element 可清晰提取嵌套结构。
例如,定义一个结构体并从 XML 构建它:
use quick_xml::de::from_str;
use serde::{Deserialize, Serialize};
#[derive(Deserialize, Debug)]
struct Book {
#[serde(rename = "@id")]
id: String,
title: String,
author: String,
}
#[derive(Deserialize, Debug)]
struct Library {
#[serde(rename = "$value")]
books: Vec<Book>,
}
// 注意:quick-xml 的 serde 支持要求 XML 标签名与字段名匹配(或用 rename)
// 且需确保 XML 是形如 <library><book>...</book></library> 这样扁平嵌套然后直接反序列化:
let data = r#"
<library>
<book id="1">
<title>Rust编程入门</title>
<author>张三</author>
</book>
</library>"#;
let library: Library = from_str(data).map_err(|e| e.to_string())?;
println!("{:#?}", library);✅ 前提是开启 quick-xml 的 serialize feature(已在 0.35+ 默认启用),并引入 serde 和 serde_derive。
<?xml version="1.0" encoding="UTF-8"?>,且文件本身是 UTF-8 编码;Rust 字符串默认 UTF-8,无需额外转码std::fs::read 而非 read_to_string 读取原始字节再交给 Reader::from_reader
reader.read_to_end(name)? 快速消耗掉整段(含子节点)Writer 类型,配合 BytesStart / BytesText 构造事件写回基本上就这些。quick-xml 上手不难,关键在于分清“流式遍历”和“结构反序列化”两种模式的适用场景——小文件、结构固定,优先用 serde;大文件、只取几个字段,用 Reader + 事件循环。
以上就是怎么用Rust语言解析XML quick-xml库教程的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号