0

0

Go语言中 binary.Uvarint 与固定长度整数解码的深入理解

霞舞

霞舞

发布时间:2025-11-24 21:15:01

|

591人浏览过

|

来源于php中文网

原创

Go语言中 binary.Uvarint 与固定长度整数解码的深入理解

本文深入探讨go语言中`binary.uvarint`函数的工作原理,解释其基于protocol buffers变长编码的特性,并通过实例详细分析为何在特定字节序列下可能无法得到预期结果。文章还将对比`uvarint`与`binary.littleendian.uint32`等固定长度解码器的区别,指导开发者根据实际编码需求选择正确的解码方法,避免常见的混淆。

引言:理解Go的 binary 包与整数编码

在Go语言中,encoding/binary 包提供了对数字和字节序列之间转换的支持,这在网络通信、文件存储或与外部系统交互时尤为重要。它包含了一系列用于处理不同编码格式的函数,例如变长整数(Varint)编码和固定长度整数(如uint32、int64)的字节序(大端或小端)编码。然而,不理解这些编码方式的具体差异,可能会导致解码时得到非预期的结果。本文将聚焦于binary.Uvarint与固定长度整数解码的区别,并通过具体案例进行深入剖析。

binary.Uvarint 的工作原理:Protocol Buffers 变长编码

binary.Uvarint 函数用于解码变长无符号整数(Unsigned Varint)。这种编码方式起源于Protocol Buffers,其主要目的是用更少的字节存储较小的数值,从而节省存储空间和传输带宽。

Varint编码的核心规则如下:

  1. 最高有效位 (MSB) 作为延续标志:每个字节的最高位(第8位)用于指示当前字节是否是Varint的一部分。如果MSB为1,表示后续还有字节需要继续解码;如果MSB为0,表示当前字节是Varint的最后一个字节。
  2. 低7位存储实际数据:每个字节的低7位用于存储整数的实际数据。
  3. 小端序存储7位组:这些7位数据组是按照小端序(Least Significant Group First)存储的。这意味着最低有效位的7位组会出现在字节序列的最前面。

案例分析:binary.Uvarint 的行为解析

假设我们有一个字节切片 [159 124124 0 0],并尝试使用 binary.Uvarint 进行解码。

立即学习go语言免费学习笔记(深入)”;

package main

import (
    "encoding/binary"
    "fmt"
)

func main() {
    slice := []byte{159, 124124, 0, 0}
    val, encodeBytes := binary.Uvarint(slice)
    fmt.Printf("Uvarint decoding: val = %d, encodeBytes = %d\n", val, encodeBytes)
}

运行上述代码,输出结果将是 val = 15903, encodeBytes = 2。这可能与我们期望的 31903 不同。下面我们详细分析 binary.Uvarint 如何得出 15903:

  1. 字节序列的二进制表示

    • 159 对应 1001 1111
    • 124124 对应 0111 1100
    • 0 对应 0000 0000
    • 0 对应 0000 0000
  2. 解码过程

    • 第一个字节 159 (1001 1111)
      • MSB 是 1,表示这不是Varint的最后一个字节。
      • 低7位是 001 1111。
    • 第二个字节 124124 (0111 1100)
      • MSB 是 0,表示这是Varint的最后一个字节。
      • 低7位是 111 1100。
    • 由于第二个字节的MSB为0,binary.Uvarint 会停止解码,后续的 0 0 字节将被忽略。
  3. 组合7位数据组: 我们提取到的两个7位数据组是:

    • 来自第一个字节:001 1111
    • 来自第二个字节:111 1100
  4. 反序与拼接: 根据Varint编码规则,这些7位组是按照小端序(least significant group first)存储的。因此,在组合成最终的数值时,需要将它们反序(即把最高有效组放在前面)。

    • 反序后:111 1100 (来自第二个字节), 001 1111 (来自第一个字节)
    • 拼接成一个完整的二进制序列:0011 1110 0001 1111
  5. 转换为十进制: 将 0011 1110 0001 1111 转换为十进制: 1*2^0 + 1*2^1 + 1*2^2 + 1*2^3 + 0*2^4 + 0*2^5 + 0*2^6 + 1*2^7 + 1*2^8 + 1*2^9 + 1*2^10 + 1*2^11 + 0*2^12 + 0*2^13 + 1*2^14 + 0*2^151 + 2 + 4 + 8 + 128 + 256 + 512 + 1024 + 2048 + 4096 + 8192 = 15903

因此,binary.Uvarint 正确地按照其定义的Varint编码规则,将 [159 124124] 解码为 15903。期望的 31903 并不是Varint编码 [159 124124 0 0] 的结果。

AdsGo AI
AdsGo AI

全自动 AI 广告专家,助您在数分钟内完成广告搭建、优化及扩量

下载

固定长度整数解码:binary.LittleEndian.Uint32

如果我们的字节序列 [159 124124 0 0] 实际上代表的是一个固定长度的32位无符号整数(uint32),并且是按照小端序(Little-Endian)存储的,那么 binary.Uvarint 就不是正确的选择。在这种情况下,我们应该使用 binary.LittleEndian.Uint32。

小端序 (Little-Endian) 意味着多字节数值的最低有效字节存储在内存地址最低的位置,而最高有效字节存储在内存地址最高的位置。对于字节序列 [159 124124 0 0],如果它是一个小端序的 uint32:

  • 159 是最低有效字节 (byte 0)
  • 124124 是次低有效字节 (byte 1)
  • 0 是次高有效字节 (byte 2)
  • 0 是最高有效字节 (byte 3)

其十进制值为: 159 * 256^0 + 124124 * 256^1 + 0 * 256^2 + 0 * 256^3= 159 + 124124 * 256 + 0 + 0= 159 + 31744= 31903

这正是我们期望的结果。

下面是使用 binary.LittleEndian.Uint32 进行解码的示例代码:

package main

import (
    "encoding/binary"
    "fmt"
)

func main() {
    slice := []byte{159, 124124, 0, 0}

    // 使用 LittleEndian.Uint32 解码固定长度的uint32
    // 确保切片长度至少为4字节
    if len(slice) >= 4 {
        val := binary.LittleEndian.Uint32(slice[:4])
        fmt.Printf("LittleEndian.Uint32 decoding: val = %d\n", val)
    } else {
        fmt.Println("Slice too short for Uint32 decoding.")
    }
}

运行此代码,将输出 LittleEndian.Uint32 decoding: val = 31903。

选择正确的解码方法

理解不同编码机制是关键。

  • binary.Uvarint:适用于处理 Protocol Buffers 等场景中使用的变长整数编码。它的特点是根据数值大小动态占用字节数,并且通过MSB来判断数值的结束。
  • binary.LittleEndian.Uint32 / binary.BigEndian.Uint32:适用于处理固定长度整数(如 uint32、uint64 等),这些整数的字节序列按照特定的字节序(小端序或大端序)排列。在与C/C++程序、网络协议或特定文件格式交互时,这种固定长度的字节序编码更为常见。

注意事项:

  • 使用 binary.Uvarint 时,它会返回解码的字节数 (encodeBytes),这对于处理连续的Varint序列非常有用。
  • 使用固定长度解码器时,务必确保输入的字节切片长度足够,否则会引发运行时错误(如 panic: slice bounds out of range)。

总结

Go语言的 encoding/binary 包提供了灵活的整数与字节序列转换功能。然而,开发者必须清楚地了解数据源所采用的具体编码方式,无论是变长整数编码(如Protocol Buffers的Varint)还是固定长度整数的字节序编码(大端或小端),并据此选择匹配的解码函数。混淆这些概念是导致解码错误和程序行为异常的常见原因。通过本文的详细分析和示例,希望能帮助开发者更准确地理解和应用Go语言中的整数编码与解码机制。

相关专题

更多
Go中Type关键字的用法
Go中Type关键字的用法

Go中Type关键字的用法有定义新的类型别名或者创建新的结构体类型。本专题为大家提供Go相关的文章、下载、课程内容,供大家免费下载体验。

234

2023.09.06

go怎么实现链表
go怎么实现链表

go通过定义一个节点结构体、定义一个链表结构体、定义一些方法来操作链表、实现一个方法来删除链表中的一个节点和实现一个方法来打印链表中的所有节点的方法实现链表。

444

2023.09.25

go语言编程软件有哪些
go语言编程软件有哪些

go语言编程软件有Go编译器、Go开发环境、Go包管理器、Go测试框架、Go文档生成器、Go代码质量工具和Go性能分析工具等。本专题为大家提供go语言相关的文章、下载、课程内容,供大家免费下载体验。

246

2023.10.13

0基础如何学go语言
0基础如何学go语言

0基础学习Go语言需要分阶段进行,从基础知识到实践项目,逐步深入。php中文网给大家带来了go语言相关的教程以及文章,欢迎大家前来学习。

697

2023.10.26

Go语言实现运算符重载有哪些方法
Go语言实现运算符重载有哪些方法

Go语言不支持运算符重载,但可以通过一些方法来模拟运算符重载的效果。使用函数重载来模拟运算符重载,可以为不同的类型定义不同的函数,以实现类似运算符重载的效果,通过函数重载,可以为不同的类型实现不同的操作。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

192

2024.02.23

Go语言中的运算符有哪些
Go语言中的运算符有哪些

Go语言中的运算符有:1、加法运算符;2、减法运算符;3、乘法运算符;4、除法运算符;5、取余运算符;6、比较运算符;7、位运算符;8、按位与运算符;9、按位或运算符;10、按位异或运算符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

228

2024.02.23

go语言开发工具大全
go语言开发工具大全

本专题整合了go语言开发工具大全,想了解更多相关详细内容,请阅读下面的文章。

281

2025.06.11

go语言引用传递
go语言引用传递

本专题整合了go语言引用传递机制,想了解更多相关内容,请阅读专题下面的文章。

158

2025.06.26

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

23

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 3.8万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号