关键在于分层展开嵌套结构,首先加载Orders节点并提取Order记录,接着展开Customer子节点属性,然后将Items列表转为表格并展开Item明细,最终实现每行对应一个商品项且保留订单与客户信息的扁平化表格。

处理复杂嵌套的XML文件并将其完美导入Excel Power Query,关键在于理解其层级结构,并利用Power Query强大的嵌套数据展开功能。虽然XML天生支持多层嵌套,但Excel表格是二维结构,因此需要系统性地“扁平化”数据,同时保留原始关系。
理解XML结构与Power Query解析机制
Power Query(通过Excel中的“获取数据”功能)能读取XML文件,但默认不会自动展开所有层级。它会将嵌套元素识别为记录(Record)或列表(List),需手动逐层提取。
以一个典型订单XML为例:
导入后,Power Query会显示根节点 Orders,其子项为多个 Order 记录。每个 Order 中可能包含属性、子节点(如 Customer)、以及子列表(如 Items)。正确识别这些类型是第一步。
分步展开嵌套层级
在Power Query编辑器中,按以下顺序操作可系统化解析:
- 加载根节点:选择 "Orders" 节点,点击展开按钮,选择仅展开 "Order" 字段,其余取消勾选。
- 提取属性与简单子节点:Order 列通常是“记录”类型,点击列右侧的展开图标,选择要提取的属性(如 ID、Date)和子节点(如 Customer)。Customer 展开后可继续提取 Name 和 City。
- 处理重复子项列表(如 Items):Items 字段通常为“列表”类型,需先点击转换为表格。可在该单元格上右键 → “转换为表”,或使用函数 Table.FromRecords 处理整列。
- 展开明细项:将 Items 转为表格后,再次展开 Item 列,提取 SKU、Qty、Price 等字段。
- 提升标题行:确保展开后的列有正确名称,必要时使用“使用第一行作为标题”功能。
保持父子关系的扁平化策略
完全扁平化后,每条 Item 应对应其父级 Order 的信息,这样才能用于后续分析(如透视表统计各城市销售额)。
关键点:
- 在展开 Items 前,确保 Order 的关键信息(如 ID、Date、Customer.Name)已提取到同级列中。
- 展开 Items 列时,其他列会自动复制到每一行,从而保留关联关系。
- 最终结果是一张宽表:每行代表一个商品项,附带所属订单和客户信息。
处理异常与优化性能
实际XML可能不规范,需增强查询鲁棒性:
- 检查空值或缺失节点,使用“填充”功能向下填充父级字段,避免因空记录导致断链。
- 对深层嵌套,可添加自定义列逐步处理,例如用 [Items]{0} 提取首个项,再转表。
- 若文件极大,考虑在高级编辑器中简化M代码,删除冗余步骤提升刷新速度。
- 使用“检测数据类型”统一字段格式,如将 Qty 和 Price 转为数字类型。
基本上就这些。只要分清记录、列表、属性三种基本结构,按层级逐步展开,就能把复杂的XML变成可用的Excel表格。难点不在工具,而在看清数据的嵌套逻辑。










