0

0

从非标准 JSON 流中提取有效 JSON 数据的 Go 语言教程

花韻仙語

花韻仙語

发布时间:2025-10-18 10:00:02

|

731人浏览过

|

来源于php中文网

原创

从非标准 json 流中提取有效 json 数据的 go 语言教程

本文介绍了一种在 Go 语言中处理包含非 JSON 内容的 JSON 数据流的有效方法。通过读取字节切片、识别并去除分隔符,然后使用 `json.Unmarshal` 进行反序列化,我们可以从不符合标准格式的输入流中提取出有效的 JSON 数据,并进行后续处理。

在实际开发中,我们有时会遇到从其他应用程序接收到的数据流,这些数据流虽然主要包含 JSON 结构,但也会夹杂一些非 JSON 格式的字符串,例如用于分隔 JSON 对象的 "end" 字符串。Go 语言标准库中的 encoding/json 包提供的 json.Decoder 在遇到非 JSON 内容时会报错,导致无法正常解析数据流。本文将介绍一种绕过这个问题的方法,即手动读取数据流,去除非 JSON 内容,然后使用 json.Unmarshal 进行反序列化。

解决方案

该方案的核心思路是:

  1. 放弃使用 json.Decoder,因为它无法处理非 JSON 内容。
  2. 从 stdin 读取字节切片。
  3. 修剪字节切片,去除分隔符(例如 \nend\n)。
  4. 将修剪后的字节切片传递给 json.Unmarshal 进行反序列化。

代码示例

以下代码展示了如何实现该方案:

笔尖Ai写作
笔尖Ai写作

AI智能写作,1000+写作模板,轻松原创,拒绝写作焦虑!一款在线Ai写作生成器

下载
package main

import (
    "bytes"
    "encoding/json"
    "fmt"
    "os"
)

// MyStruct 定义了 JSON 数据的结构
type MyStruct struct {
    Command string `json:"command"`
    ID      string `json:"id"`
    Msg     string `json:"msg,omitempty"` //omitempty 表示如果该字段为空,则不序列化
}

func main() {
    // 创建一个缓冲区来保存流数据
    data := make([]byte, 5000) // 根据实际情况调整缓冲区大小

    // 从 stdin 循环读取数据
    for {
        n, err := os.Stdin.Read(data)
        if err != nil {
            fmt.Println("读取错误:", err)
            return // 或使用 panic(err) 取决于错误处理策略
        }

        // 查找换行符的位置,用于分割 JSON 对象
        index := bytes.Index(data[:n], []byte("\n"))
        if index == -1 {
            fmt.Println("未找到换行符,可能数据不完整")
            continue // 继续下一次循环,等待更多数据
        }

        // 提取 JSON 数据部分
        jsonData := data[:index]

        // 创建 MyStruct 实例
        var myStruct MyStruct

        // 反序列化 JSON 数据
        err = json.Unmarshal(jsonData, &myStruct)
        if err != nil {
            fmt.Println("JSON 反序列化错误:", err)
            continue // 继续下一次循环,处理下一个 JSON 对象
        }

        // 对 myStruct 进行处理
        fmt.Printf("解析到的结构体: %+v\n", myStruct)

        // 移除已处理的数据和分隔符 "end\n"
        remainingData := data[index+1:]

        // 检查是否包含 "end\n" 分隔符
        endIndex := bytes.Index(remainingData[:n-index-1], []byte("end\n"))
        if endIndex == -1 {
            fmt.Println("未找到 'end\\n' 分隔符")
            continue
        }

        // 移动剩余数据到缓冲区开头
        copy(data, remainingData[endIndex+len("end\n"):])
        // 重置缓冲区剩余部分
        for i := len(remainingData[endIndex+len("end\n"):]); i < len(data); i++ {
            data[i] = 0
        }
    }
}

代码解释:

  • MyStruct: 定义了一个结构体,用于存储从 JSON 数据中提取的信息。json:"command" 等标签用于指定 JSON 字段与结构体字段之间的映射关系。omitempty 选项表示如果结构体字段为空,则在序列化时忽略该字段。
  • os.Stdin.Read(data): 从标准输入读取数据到 data 缓冲区。
  • bytes.Index(data[:n], []byte("\n")): 查找换行符的位置,用于分割 JSON 对象。n 是实际读取到的字节数。
  • json.Unmarshal(jsonData, &myStruct): 将 JSON 数据反序列化到 myStruct 结构体中。
  • 错误处理: 代码中包含了错误处理,用于处理读取错误和 JSON 反序列化错误。
  • 数据清洗: 找到并移除end\n分隔符,并将剩余的数据复制到缓冲区开头,为下一次循环读取数据做准备。

注意事项

  • 缓冲区大小: data 缓冲区的大小需要根据实际情况进行调整。如果缓冲区太小,可能会导致数据丢失
  • 错误处理: 在实际应用中,需要更完善的错误处理机制,例如记录错误日志、重试等。
  • 性能: 对于高吞吐量的数据流,可以考虑使用更高效的读取和解析方法,例如使用 bufio.Scanner 或第三方 JSON 解析库。
  • 分隔符: 代码中的分隔符是 \nend\n,需要根据实际情况进行修改。
  • 数据清洗: 在实际应用中,可能需要更复杂的数据清洗逻辑,例如去除空白字符、转义字符等。

总结

本文介绍了一种在 Go 语言中处理包含非 JSON 内容的 JSON 数据流的有效方法。通过手动读取数据流,去除非 JSON 内容,然后使用 json.Unmarshal 进行反序列化,我们可以从不符合标准格式的输入流中提取出有效的 JSON 数据,并进行后续处理。 在实际应用中,需要根据具体情况调整代码,例如调整缓冲区大小、完善错误处理机制、优化性能等。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

417

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

533

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

310

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

75

2025.09.10

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

278

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

212

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1489

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

621

2023.11.24

Golang 性能分析与pprof调优实战
Golang 性能分析与pprof调优实战

本专题系统讲解 Golang 应用的性能分析与调优方法,重点覆盖 pprof 的使用方式,包括 CPU、内存、阻塞与 goroutine 分析,火焰图解读,常见性能瓶颈定位思路,以及在真实项目中进行针对性优化的实践技巧。通过案例讲解,帮助开发者掌握 用数据驱动的方式持续提升 Go 程序性能与稳定性。

5

2026.01.22

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
WEB前端教程【HTML5+CSS3+JS】
WEB前端教程【HTML5+CSS3+JS】

共101课时 | 8.4万人学习

JS进阶与BootStrap学习
JS进阶与BootStrap学习

共39课时 | 3.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号