结构体与JSON如何互相转换序列化与反序列化实现方法

P粉602998670

发布时间：2025-08-15 15:49:01

544人浏览过

来源于php中文网

原创

1.结构体与json的互相转换是序列化与反序列化过程，用于数据传输和存储。2.在go中，使用encoding/json库实现该功能，通过json.marshal()进行序列化，将结构体转为json字符串；通过json.unmarshal()进行反序列化，将json字符串解析为结构体。3.结构体字段使用json标签定义json键名，omitempty控制空值输出，字段大小写需明确映射以避免匹配错误。4.常见陷阱包括类型不匹配、嵌套结构处理复杂、日期格式不兼容等，解决策略包括使用指针类型处理可选字段、自定义marshaler/unmarshaler接口处理特殊逻辑、以及严格校验输入。5.其他数据格式如xml冗长适合文档交换，protobuf高效适合高性能场景，yaml易读适合配置文件。6.处理动态json时可使用map[string]interface{}或json.rawmessage结合固定结构体，同时引入schema验证和容错机制确保稳定性。

结构体与JSON如何互相转换序列化与反序列化实现方法

JSON和结构体（或编程语言中的对象）之间的互相转换，本质上就是数据的“序列化”和“反序列化”过程。简单来说，序列化是将内存中的复杂数据结构（比如你定义的结构体）转换成一种可传输或可存储的文本格式（如JSON字符串），而反序列化则是将这种文本格式的数据解析回来，重新构建成内存中的结构体。这个过程是现代网络通信、数据持久化以及不同系统间数据交换的基石。

解决方案

要实现结构体与JSON的互相转换，大多数主流编程语言都提供了非常成熟的内置库或第三方库。以Go语言为例，其标准库

encoding/json

就提供了极其便捷且强大的功能。

结构体到JSON（序列化）：

这个过程通常称为“编码”或“Marshal”。你有一个Go语言的结构体实例，想把它变成一个JSON字符串。

package main

import (
    "encoding/json"
    "fmt"
    "log"
)

type User struct {
    ID       int    `json:"id"`
    Username string `json:"username"`
    Email    string `json:"email,omitempty"` // omitempty表示如果为空值则不输出此字段
    IsActive bool   `json:"is_active"`
    Roles    []string `json:"roles"`
}

func main() {
    user := User{
        ID:       101,
        Username: "zhangsan",
        Email:    "zhangsan@example.com",
        IsActive: true,
        Roles:    []string{"admin", "editor"},
    }

    // 序列化结构体到JSON
    jsonData, err := json.Marshal(user)
    if err != nil {
        log.Fatalf("序列化失败: %v", err)
    }
    fmt.Printf("序列化后的JSON字符串:\n%s\n", jsonData)

    // 如果需要格式化输出，可以使用json.MarshalIndent
    prettyJSONData, err := json.MarshalIndent(user, "", "  ")
    if err != nil {
        log.Fatalf("格式化序列化失败: %v", err)
    }
    fmt.Printf("\n格式化后的JSON字符串:\n%s\n", prettyJSONData)
}

这里关键是

json.Marshal()

函数。它接收一个Go接口类型的值，并尝试将其转换为JSON字节切片。结构体字段旁边的

json:"id"

这样的标签（tag）非常重要，它告诉

encoding/json

库在JSON中应该使用哪个键名来表示这个字段。如果没有指定tag，默认会使用结构体字段名的小写形式。

omitempty

标签则允许你在字段为空（如字符串为空、数字为0、布尔为false、切片/映射为nil）时，不将其包含在JSON输出中，这在处理可选字段时特别有用。

JSON到结构体（反序列化）：

这个过程通常称为“解码”或“Unmarshal”。你有一个JSON字符串，想把它解析回一个Go结构体实例。

package main

import (
    "encoding/json"
    "fmt"
    "log"
)

type User struct {
    ID       int    `json:"id"`
    Username string `json:"username"`
    Email    string `json:"email,omitempty"`
    IsActive bool   `json:"is_active"`
    Roles    []string `json:"roles"`
}

func main() {
    jsonString := `{"id":102,"username":"lisi","email":"lisi@example.com","is_active":false,"roles":["user"]}`

    var user User
    // 反序列化JSON字符串到结构体
    err := json.Unmarshal([]byte(jsonString), &user)
    if err != nil {
        log.Fatalf("反序列化失败: %v", err)
    }
    fmt.Printf("反序列化后的结构体:\n%+v\n", user)

    // 尝试反序列化一个缺少字段的JSON
    partialJsonString := `{"id":103,"username":"wangwu"}`
    var partialUser User
    err = json.Unmarshal([]byte(partialJsonString), &partialUser)
    if err != nil {
        log.Fatalf("部分反序列化失败: %v", err)
    }
    fmt.Printf("\n反序列化缺少字段的JSON:\n%+v\n", partialUser) // Email和IsActive会是默认零值
}

json.Unmarshal()

函数接收一个JSON字节切片和一个指向目标结构体变量的指针。它会根据JSON键名和结构体字段的tag进行匹配，将JSON数据填充到结构体中。如果JSON中存在结构体中没有的字段，它们会被忽略；如果结构体中有JSON中没有的字段，它们会保持其类型的零值。

在实际开发中，JSON序列化与反序列化有哪些常见陷阱和处理策略？

在日常编码中，JSON的序列化和反序列化虽然方便，但确实有一些常见的“坑”需要注意，处理不好就容易出问题。

一个比较常见的陷阱是字段名的大小写匹配。JSON通常推荐使用

camelCase

（驼峰命名）或

snake_case

（下划线命名），而许多编程语言（如Go）的结构体字段名习惯用

PascalCase

（大驼峰命名）。如果直接让库去猜测，很可能匹配不上。所以，明确使用
json
标签来指定JSON键名几乎是最佳实践。比如，Go的

json:"user_name"

就能很好地解决Go结构体字段

UserName

与JSON键

user_name

的映射问题。

另一个让人头疼的是数据类型不匹配。比如，JSON中某个字段是数字，但你的结构体对应字段定义成了字符串；或者JSON里是

null

，而你的结构体字段是基本类型（如

int

、

bool

），这可能导致反序列化失败。对于可选字段，如果JSON中可能不存在或者为

null

，可以考虑在结构体中使用指针类型（如

*int

、

*string

）或自定义类型来处理，这样

null

可以被正确地解析为

nil

。Go的

omitempty

标签在序列化时很有用，但在反序列化时，如果字段缺失，它会自然地被赋为零值，这通常符合预期。

处理嵌套结构和数组时，虽然大部分库都能自动处理，但如果嵌套层级很深，或者结构非常复杂，手动编写代码去解析可能会变得非常繁琐。这时，确保你的结构体定义与JSON的层级和类型严格对应是关键。如果JSON的结构是动态变化的，或者某些字段的类型不固定，那么直接反序列化到固定结构体就不太可行了。可以考虑先反序列化到

interface{}

（Go）或

Map

（Java），然后手动遍历和类型断言来处理，或者使用一些更灵活的库。

还有就是日期时间格式。JSON本身没有标准的日期时间类型，通常以字符串表示。如果你的结构体字段是

time.Time

（Go）或

Date

（JavaScript），而JSON中的日期字符串格式不符合库的默认解析规则，就会报错。这时，你需要实现自定义的
Marshaler
和
Unmarshaler
接口，来告诉库如何将特定格式的日期字符串转换为日期对象，反之亦然。这虽然增加了代码量，但能让你完全掌控日期时间的解析逻辑。

最后，别忘了错误处理。

json.Marshal

和

json.Unmarshal

都返回错误。始终检查这些错误，否则你可能会在不经意间处理了无效或不完整的数据，导致运行时崩溃或逻辑错误。对于生产系统，详细的错误日志和降级策略是必不可少的。

除了JSON，其他常见的数据交换格式如XML、Protobuf、YAML与结构体转换有何不同？

在数据交换的世界里，JSON确实是当之无愧的“网红”，但它并非唯一的选择。XML、Protobuf、YAML等各有千秋，它们与结构体转换的方式和侧重点也大相径庭。

XML (eXtensible Markup Language) 是JSON的“老大哥”，曾经在企业级应用中占据主导地位。它也是基于文本的，但语法比JSON更冗长，使用标签来定义数据结构，有点像HTML。与结构体转换时，XML通常需要更复杂的解析器。比如，在Go中，

encoding/xml

库可以完成这个任务，但你需要处理元素、属性、文本内容等多个维度，其结构体标签也与JSON不同（如

xml:"name,attr"

用于属性，

xml:",innerxml"

用于内部内容）。XML的优点在于其强大的可扩展性和对Schema的严格支持，可以定义非常复杂的文档结构并进行验证。但缺点也很明显：冗余、解析复杂、性能相对较低，在追求轻量和高效的现代Web服务中逐渐被JSON取代。

SlidesAI

使用SlidesAI的AI在几秒钟内创建演示文稿幻灯片

下载

Protobuf (Protocol Buffers) 是Google开发的一种语言无关、平台无关、可扩展的序列化机制。它与JSON和XML最大的不同在于，它是二进制的。这意味着它序列化后的数据非常紧凑，传输效率高，解析速度快。与结构体转换时，你需要先定义一个

.proto

文件来描述你的数据结构（类似于JSON Schema，但更严格），然后通过编译器生成各种语言的对应代码（如Go结构体、Java类等）。这些生成的代码包含了序列化和反序列化的逻辑。Protobuf的优点是高性能、高效率、强类型检查，非常适合对性能敏感的RPC通信场景。缺点是可读性差（二进制），需要预先定义Schema，并且修改Schema时可能需要重新编译所有使用方。

YAML (YAML Ain't Markup Language) 是一种人类友好的数据序列化标准。它的设计哲学是“易读性”，语法简洁，通过缩进和符号来表示层级关系。YAML是JSON的超集，意味着所有合法的JSON文档都是合法的YAML文档。它常用于配置文件、日志文件、跨语言数据交换等场景。与结构体转换时，许多语言都提供了相应的库（如Go的

gopkg.in/yaml.v3

），转换方式与JSON类似，也是通过字段名或标签进行映射。YAML的优点是极佳的可读性、表达能力强（支持锚点、引用等高级特性），非常适合人工编辑和阅读的场景。缺点是解析器实现相对复杂，对缩进敏感，有时可能因为一个空格或制表符导致解析失败。

总结一下：

JSON： 轻量、易读（相对）、广泛支持、网络API首选。
XML： 结构复杂、Schema严格、冗余、老系统和文档交换。
Protobuf： 高性能、二进制、强类型、RPC和内部服务。
YAML： 人类友好、配置为主、可读性强、超集JSON。

选择哪种格式，取决于你的具体需求：是追求极致的性能和效率，还是需要人类高度可读的配置文件，抑或是通用的Web API数据交换。

面对复杂或动态的JSON结构，我们该如何进行高效的序列化与反序列化？

处理复杂或动态的JSON结构，确实是JSON操作中比较有挑战性的部分。这里的“复杂”可能指深层嵌套、字段数量庞大，而“动态”则可能意味着JSON的结构在运行时不完全固定，某些字段可能出现或消失，甚至类型也可能变化。

对于复杂但结构相对固定的JSON，核心策略是精心设计你的结构体。Go语言的

encoding/json

库能够非常优雅地处理嵌套结构和数组。你只需要将JSON中的对象映射为Go结构体，将JSON数组映射为Go的切片（

[]Type

）。只要JSON的键名和类型与你的结构体字段（通过

json

标签）匹配，序列化和反序列化通常都能无缝进行。使用

json-to-go.com

这类在线工具，可以快速将一个JSON示例转换为对应的Go结构体定义，这在处理大型或多层嵌套的JSON时，能极大地提高效率并减少手动定义可能出现的错误。

然而，当JSON结构变得动态或不确定时，仅仅依赖固定结构体就不够了。

一种常见的处理方式是使用泛型数据结构。在Go中，这意味着将JSON反序列化到

map[string]interface{}

或

[]interface{}

。

interface{}

可以代表任何类型，因此它能够容纳JSON中的任意值（字符串、数字、布尔、对象、数组、null）。

package main

import (
    "encoding/json"
    "fmt"
    "log"
)

func main() {
    dynamicJson := `{"name":"Alice","age":30,"details":{"city":"New York","occupation":"Engineer"},"tags":["tech","travel"]}`

    var rawData map[string]interface{}
    err := json.Unmarshal([]byte(dynamicJson), &rawData)
    if err != nil {
        log.Fatalf("反序列化动态JSON失败: %v", err)
    }

    fmt.Printf("反序列化到map[string]interface{}:\n%+v\n", rawData)

    // 访问数据需要类型断言
    if name, ok := rawData["name"].(string); ok {
        fmt.Printf("姓名: %s\n", name)
    }

    if details, ok := rawData["details"].(map[string]interface{}); ok {
        if city, ok := details["city"].(string); ok {
            fmt.Printf("城市: %s\n", city)
        }
    }
}

这种方法非常灵活，但缺点也很明显：失去类型安全。每次访问数据都需要进行类型断言，这不仅增加了代码的复杂性，也容易在运行时出现类型错误（panic）。

面对这种挑战，可以考虑以下几种策略：

部分固定结构 + 泛型混合： 如果JSON的大部分结构是固定的，只有少数部分是动态的，那么可以定义一个包含固定字段的结构体，对于动态部分，则将其定义为
```
json.RawMessage
```
或
```
interface{}
```
。
```
json.RawMessage
```
会原封不动地保留那部分JSON的原始字节，你可以之后再对其进行二次解析。
```
type Event struct {
    EventType string          `json:"event_type"`
    Timestamp int64           `json:"timestamp"`
    Payload   json.RawMessage `json:"payload"` // 动态部分
}
// 然后根据EventType，再Unmarshal Payload到不同的结构体
```
自定义
```
Marshaler
```
和
Unmarshaler
接口：这是最强大的方式，允许你完全控制序列化和反序列化的过程。通过实现
```
json.Marshaler
```
和
```
json.Unmarshaler
```
接口，你可以手动解析或构建JSON，处理各种复杂的逻辑，例如：
- 处理非标准格式的日期时间。
- 在反序列化时进行数据验证。
- 根据某个字段的值，将另一个字段反序列化到不同的结构体（即所谓的“判别器”模式）。
- 将一个Go类型映射到JSON中的多种表示形式。
JSON Schema验证： 在处理外部传入的JSON时，尤其是在API网关或服务入口处，使用JSON Schema对JSON结构进行预先验证是一个非常好的实践。这能确保你接收到的JSON符合预期的结构和类型，从而避免后续反序列化时的错误。虽然Go标准库没有内置JSON Schema验证，但有许多优秀的第三方库（如
```
github.com/xeipuus/gojsonschema
```
）可以完成这个任务。
容错性设计： 在反序列化时，预料到字段可能缺失或类型不匹配的情况。对于可选字段，使用指针类型或自定义类型来处理
```
null
```
。对于可能缺失的字段，确保你的代码在访问它们时能优雅地处理零值或错误。