Matlab通过xmlread读取XML得到Java DOM对象,需用getElementsByTagName和getTextContent提取内容,xmlwrite仅支持DOM对象写入;中文需UTF-8声明,大文件易内存溢出,推荐JSON中转或xml2struct工具。

Matlab读取XML文件:用 xmlread 得到 DOM 文档对象
Matlab 本身不直接解析 XML 成结构化变量(比如 table 或 struct),而是通过 Java 的 DOM API 加载为 org.w3c.dom.Document 对象。这意味着你得手动遍历节点,不能像 Python 的 xml.etree.ElementTree 那样直接用 .find() 返回子元素对象。
常见错误是调用 xmlread 后直接试图用点号访问字段,比如 doc.root —— 这会报错,因为返回的是 Java 对象,不是 Matlab 结构体。
-
xmlread只接受文件路径字符串,不支持 URL 或字节流 - 若 XML 文件含中文且无声明编码(如
),Windows 系统下可能乱码;建议统一保存为 UTF-8 并显式声明 - 大文件(>50MB)可能导致内存溢出,此时应考虑用 SAX(Matlab 不原生支持,需自写 Java 类)或转为文本预处理
doc = xmlread('data.xml'); % 返回 org.w3c.dom.Document
root = doc.getDocumentElement; % 获取根节点(org.w3c.dom.Element)
nodeName = char(root.getNodeName); % 转为 Matlab 字符串需用 char()
提取XML节点内容:用 getElementsByTagName 和 getTextContent
DOM 操作的核心是“找节点 → 取内容”。Matlab 封装了常用 Java 方法,但命名和行为与原生 Java 一致,比如 getElementsByTagName 返回的是 org.w3c.dom.NodeList,不是数组,必须用索引 item(0) 获取单个节点。
容易踩的坑是忽略空格文本节点:XML 中换行缩进会被当作 TEXT_NODE,导致 getChildNodes 返回一堆空白节点,误判子元素数量。
- 用
getElementsByTagName('tagname')比遍历所有子节点更可靠 - 取值务必链式调用:
nodeList.item(0).getTextContent,中间任一环节为null会报 Java 异常 - 数字或布尔值需手动转换:
str2double(char(...))或strcmpi(char(...), 'true')
nodes = root.getElementsByTagName('price');
if nodes.getLength > 0
priceNode = nodes.item(0);
priceStr = char(priceNode.getTextContent); % 注意 char() 转换
priceVal = str2double(priceStr);
end
Matlab写入XML文件:靠 xmlwrite 输出 DOM 对象
xmlwrite 只能写入由 xmlread 读取后修改的 DOM 对象,或完全用 Java 方法新建的 DOM(如 doc.createElement)。它**不接受 struct、table、cell 等 Matlab 原生数据类型**——没有“一键导出”函数。
这意味着:想从头生成 XML,必须手动创建文档、元素、属性、文本节点,再逐级 append。过程冗长,且易因节点归属错误(如把 element append 到 text node)导致运行时报错。
- 新建文档要用
com.mathworks.xml.XMLUtils.createDocument,不是xmlread('') - 所有文本内容必须用
doc.createTextNode(char(...))包裹,直接传 string 会失败 -
xmlwrite默认不缩进,输出是单行;如需格式化,得额外调用 Java 的Transformer类(Matlab 未封装)
doc = com.mathworks.xml.XMLUtils.createDocument;
root = doc.createElement('bookstore');
doc.appendChild(root);
titleElem = doc.createElement('title');
titleText = doc.createTextNode(char('MATLAB Guide'));
titleElem.appendChild(titleText);
root.appendChild(titleElem);
xmlwrite(doc, 'output.xml'); % 写入文件
替代方案:用 webread + JSON 中转或第三方工具
如果 XML 结构固定、字段不多,硬写 DOM 操作效率低且难维护。更实际的做法是:用外部工具先转成 JSON(如命令行用 xml2json),再用 Matlab 的 jsondecode 读取;或反向用 jsonencode 生成 JSON 后转 XML(需额外脚本)。
另一个选择是使用 File Exchange 上的 xml2struct(作者:Jaroslaw Tuszynski),它封装了 DOM 遍历逻辑,能将简单 XML 映射为嵌套 struct,但对属性、命名空间、重复标签支持有限,且不维护多年。
- 纯属性 XML(如
)在xml2struct中会丢失,需手动补全 - 含 CDATA 或特殊字符(
&,)时,xml2struct可能解析失败,而原生xmlread能正确处理 - 如果项目允许调用系统命令,
webread(['!xmlstar -U -t -v "/root/item/name" data.xml'])是快速提取单值的捷径
DOM 操作绕不开 Java 接口细节,最易被忽略的是节点所有权和生命周期:Java 对象在 Matlab 中不自动垃圾回收,大量读写后可能内存泄漏,尤其在循环中反复 xmlread 却不 clear 变量时。










