使用 Go 解析 XML 时处理命名空间

聖光之護

发布时间：2025-09-26 18:27:06

748人浏览过

来源于php中文网

原创

使用 go 解析 xml 时处理命名空间

本文将介绍在使用 Go 语言解析 XML 文档时，如何处理命名空间问题。Go 的 encoding/xml 包提供了强大的 XML 解析功能，但默认情况下，它会按照 XML 结构中的顺序解析元素，而忽略命名空间。本文将提供一种方法，通过自定义结构体和后处理数据，来提取特定命名空间或无命名空间的元素内容，从而解决在解析包含命名空间的 XML 文档时遇到的问题。

在 Go 语言中使用 encoding/xml 包解析 XML 文档时，如果 XML 文档中包含命名空间，直接使用结构体标签进行映射可能会遇到问题。例如，当 XML 文档中同时存在带有和不带有命名空间的同名元素时，默认的解析行为可能无法准确提取所需的数据。

示例：解析包含命名空间的 XML

假设我们有以下 XML 文档：


  A
  B

我们希望提取不带命名空间的元素的值 "A"。如果直接使用以下 Go 代码：

package main

import (
    "encoding/xml"
    "fmt"
)

type XML struct {
    Foo string `xml:"foo"`
}

func main() {
    rawXML := []byte(`

  A
  B
`)

    x := new(XML)
    xml.Unmarshal(rawXML, x)
    fmt.Printf("foo: %s\n", x.Foo)
}

运行结果会是：

foo: B

这是因为 xml.Unmarshal 按照 XML 结构中的顺序解析，并将最后一个元素的值赋给了 x.Foo。

解决方案：自定义结构体和后处理

Python之模块学习中文WORD版

本文档主要讲述的是Python之模块学习；python是由一系列的模块组成的，每个模块就是一个py为后缀的文件，同时模块也是一个命名空间，从而避免了变量名称冲突的问题。模块我们就可以理解为lib库，如果需要使用某个模块中的函数或对象，则要导入这个模块才可以使用，除了系统默认的模块（内置函数）不需要导入外。希望本文档会给有需要的朋友带来帮助；感兴趣的朋友可以过来看看

下载

为了解决这个问题，我们可以使用自定义结构体，并利用 xml.Name 字段来获取元素的命名空间信息，然后在解析后对数据进行后处理。

以下是修改后的 Go 代码：

package main

import (
    "encoding/xml"
    "fmt"
)

type Foo struct {
    XMLName xml.Name
    Data    string `xml:",chardata"`
}

type XML struct {
    Foo []Foo `xml:"foo"`
}

func main() {
    rawXML := []byte(`

  A
  B
`)

    x := new(XML)
    xml.Unmarshal(rawXML, x)

    for _, el := range x.Foo {
        if el.XMLName.Space == "" {
            fmt.Printf("non namespaced foo: %q\n", el.Data)
        }
    }
}

在这个修改后的代码中：

我们定义了一个 Foo 结构体，其中包含 XMLName xml.Name 字段，用于存储元素的命名空间信息，以及 Data string \xml:",chardata"`` 字段，用于存储元素的内容。
我们将 XML 结构体中的 Foo 字段类型改为 []Foo，以便存储所有名为 foo 的元素。
在解析 XML 后，我们遍历 x.Foo，检查每个元素的 XMLName.Space 字段，如果该字段为空，则表示该元素没有命名空间，我们就可以提取其内容。

运行结果如下：