rune用于处理Unicode字符,byte用于ASCII或字节操作;中文等多字节字符用rune才能准确计数和遍历。

在Go语言中,rune 和 byte 是两个常用于处理字符和字符串的类型,但它们的用途和底层表示有明显区别。理解它们的不同,对正确处理文本(尤其是中文等多字节字符)非常重要。
byte 是 uint8 的别名,表示一个字节
byte 实际上是 uint8 的别名,用来表示 8 位无符号整数,取值范围是 0 到 255。它通常用于处理 ASCII 字符或原始字节数据。
例如,英文字符 'A' 的 ASCII 码是 65,可以用 byte 表示:
- 单个 byte 能表示一个 ASCII 字符
- 在字符串遍历时,使用
[]byte(str)
或 range 得到的是每个字节 - 对于非 ASCII 字符(如中文),一个字符可能占用多个字节
rune 是 int32 的别名,表示一个Unicode码点
rune 是 int32 的别名,用来表示一个 Unicode 字符(即一个码点)。它可以正确表示包括中文、emoji 等在内的任何 Unicode 字符。
立即学习“go语言免费学习笔记(深入)”;
例如,汉字“你”的 Unicode 码点是 U+4F60,需要用 rune 才能准确表示。
- rune 能完整表示任意 Unicode 字符
- 字符串中的中文字符,在按 rune 遍历时会被当作一个单位
- 使用
[]rune(str)
可以将字符串转为 Unicode 码点切片
实际使用中的关键差异
看一个例子更容易理解:
str := "你好, world!" fmt.Println(len(str)) // 输出: 13 (字节数) fmt.Println(len([]rune(str))) // 输出: 9 (字符数,包含中文)
len(str)
返回字节数,因为字符串底层是字节序列- 中文“你”“好”各占 3 字节(UTF-8 编码),所以总字节数更多
- 用
[]rune(str)
才能得到真正的“字符个数” - 遍历字符串时,若用 for range 直接遍历 str,得到的是字节索引;若转换为 []rune,则按字符遍历
基本上就这些。简单说:处理 ASCII 或二进制数据用 byte,处理国际化文本、中文、emoji 用 rune,避免乱码和长度误判。










