答案是使用R语言处理XML数据并导出为Excel文件。首先安装并加载xml2和writexl包,接着用read_xml()读取data.xml文件,解析后提取person节点信息,将name、age、city等字段构建成数据框,最后通过write_xlsx()将数据框保存为Excel文件,完成结构化数据转换。

处理XML数据并将其导出为Excel文件是R语言中常见的数据转换任务,尤其适用于从网页、API或结构化文档中提取信息。本教程将带你一步步使用R读取XML文件、提取所需内容,并保存为Excel格式。
1. 安装并加载必要的R包
要处理XML和导出Excel,需要以下两个核心R包:
- xml2:用于读取和解析XML文件
- writexl:用于将数据框快速导出为.xlsx文件(无需Java依赖)
install.packages("writexl")
library(xml2)
library(writexl)
2. 读取并解析XML文件
假设你有一个名为data.xml的文件,结构如下:
使用read_xml()读取该文件:
接着提取所有节点,并逐项提取字段:
names ages cities ids
3. 构建数据框并导出为Excel
将提取的数据合并为一个数据框:
df ID = ids,Name = names,
Age = ages,
City = cities
)
使用writexl::write_xlsx()导出为Excel文件:
执行后会在工作目录生成output.xlsx,打开即可查看结构化数据。
4. 处理复杂嵌套结构的小贴士
若XML结构更复杂(如多层嵌套),可结合lapply逐节点处理:
ID = xml_attr(node, "id"),
Name = xml_text(xml_find_first(node, "name")),
Age = xml_text(xml_find_first(node, "age")),
City = xml_text(xml_find_first(node, "city"))
)
}
result_list df
这种方法更灵活,适合不规则或深层嵌套的XML文档。
基本上就这些。掌握XML解析和Excel导出后,你可以轻松将各种结构化文本数据转换为便于分析的表格格式。操作不复杂但容易忽略细节,比如编码问题或路径写错。确保XML文件路径正确,中文能正常显示即可。










