Go中字符串是UTF-8字节序列,len(s)返回字节数而非字符数;应使用for range遍历rune,或转[]rune切片操作字符。

在 Go 中,字符串是 UTF-8 编码的字节序列,不是 Unicode 码点数组。因此,直接用索引访问“字符”可能出错——尤其遇到中文、emoji 等多字节字符时,下标取到的是单个字节,而非完整字符。
字符串长度 ≠ 字符个数
Go 的 len(s) 返回字节数,不是 rune(Unicode 码点)个数。例如:
s := "你好"
len(s) → 6(每个中文占 3 字节)
utf8.RuneCountInString(s) → 2(真正有 2 个字符)
用 for range 安全遍历字符(rune)
这是获取每个“逻辑字符”的推荐方式,自动按 UTF-8 解码:
- 每次迭代得到
index(字节偏移)和rune(Unicode 码点) - 适合逐个处理字符、查找位置、统计字符数
s := "Go编程?"
for i, r := range s {
fmt.Printf("位置 %d: %c (U+%04X)\n", i, r, r)
}
按字节索引取子串:仅限 ASCII 或明确字节边界场景
若确定字符串全是 ASCII(如英文、数字、符号),可安全用切片:
立即学习“go语言免费学习笔记(深入)”;
-
s[2:5]→ 取第 2 到第 4 个字节(左闭右开) -
s[0]→ 第一个字节(对 ASCII 就是第一个字符) - ⚠️ 对中文或 emoji 直接用
s[1]可能截断 UTF-8 编码,导致乱码或 panic
按字符位置获取子串:先转为 rune 切片
需要“第 n 个字符”或“从第 i 个字符起取 m 个字符”,必须先转成 []rune:
-
runes := []rune(s)—— 将字符串解码为 Unicode 码点切片 -
runes[1]→ 第二个字符(rune 类型) -
string(runes[1:3])→ 从第 2 个字符起取 2 个字符组成的字符串
s := "Hello世界"
rs := []rune(s)
fmt.Println(string(rs[0:5])) // "Hello"
fmt.Println(string(rs[5:7])) // "世界"










