PHP处理XML重复节点有五种方法:一、SimpleXML配合XPath获取全部同名节点;二、DOMDocument遍历getElementsByTagName结果;三、XMLReader流式读取并提取inner XML;四、自定义SimpleXMLElement扩展类重载__get行为;五、转JSON再反解为带数字索引的数组。

如果PHP解析XML时遇到多个同名节点,而默认的simplexml_load_string或DOM解析方式仅返回最后一个节点值,则无法完整获取重复节点的数据。以下是处理XML重复节点的多种方法:
一、使用SimpleXML配合XPath定位所有同名节点
SimpleXML本身对重复节点的直接属性访问会覆盖前值,但可通过XPath查询获取全部匹配节点对象,再逐个提取内容。
1、将XML字符串传入simplexml_load_string函数生成SimpleXMLElement对象。
2、调用xpath方法并传入节点路径表达式,例如'//item',返回包含全部匹配节点的数组。
立即学习“PHP免费学习笔记(深入)”;
3、遍历该数组,对每个节点分别调用->__toString()或访问其子元素属性。
4、将各节点数据存入PHP数组,确保不丢失任一重复项。
二、使用DOMDocument逐节点遍历同名元素
DOMDocument提供更底层的节点控制能力,可精确获取同名标签的所有Element实例,并支持属性、文本内容及嵌套结构的完整读取。
1、实例化DOMDocument对象并调用loadXML方法加载XML字符串。
2、使用getElementsByTagName方法传入目标节点名,返回DOMNodeList对象。
3、通过for循环遍历DOMNodeList的length,逐个访问item索引下的节点。
4、对每个节点调用textContent获取纯文本,或使用childNodes遍历其子节点结构。
三、使用XMLReader流式读取并累积同名节点
XMLReader适用于大体积XML文件,以只进游标方式逐个读取事件,当遇到目标开始标签时进入收集状态,直到对应结束标签为止,从而天然区分不同重复节点的边界。
1、新建XMLReader实例并调用open方法加载XML数据源。
2、使用read方法推进至下一个节点,判断nodeType是否为XMLReader::ELEMENT且nodeName匹配目标名称。
3、检测到匹配开始标签后,调用readInnerXML获取该节点完整内部XML字符串。
4、将每次读取的inner XML存入数组,后续统一用simplexml_load_string解析单个片段。
四、自定义SimpleXML扩展类重载__get行为
通过继承SimpleXMLElement并注册自定义autoload类,在访问重复节点名时自动返回所有同名子节点组成的数值索引数组,而非默认的首个节点。
1、定义新类MySimpleXML扩展SimpleXMLElement,并实现public function __get($name)方法。
2、在__get中调用xpath("//{$name}"),判断返回数组长度是否大于1。
3、若存在多个,返回xpath结果;否则返回parent::__get($name)。
4、调用simplexml_load_string时指定第二个参数为该类名,启用自定义逻辑。
五、转换为JSON后再反解为PHP数组(需保证XML结构扁平)
借助第三方库如xml2json或手动构造关联数组,将XML转为JSON字符串,再用json_decode($json, true)获得含数字键的嵌套数组,其中重复节点自动成为同级索引项。
1、编写递归函数遍历SimpleXMLElement,对每个节点检查children()数量与getName()是否重复出现。
2、当发现同名子节点时,强制将该子节点名映射为数组而非单值。
3、拼装键值对生成标准PHP数组,再调用json_encode转为JSON字符串。
4、执行json_decode($json, true),获得含0、1、2等数字下标的重复节点数组。











