
1. 问题背景:%*在Go中为何失效?
在c语言的scanf系列函数中,%*是一个非常有用的格式化动词,它允许我们读取输入流中的数据,但不对其进行赋值,从而有效地忽略某个字段。然而,在go语言中,尽管fmt包声称其函数与c的printf和scanf类似,但尝试在fmt.sscanf中使用%*(例如%*d)时,会遇到运行时错误,提示“bad verb %* for integer”。
这并非编译错误,因为Go编译器将格式字符串视为普通字符串,其内容在运行时才由fmt包的函数解析。fmt包的设计者并未实现%*这种赋值抑制功能,因此在运行时,解析器无法识别这个动词,从而抛出错误。go vet工具可能会尝试对格式字符串和参数进行匹配性检查,但对于未实现的动词,它也无能为力。
鉴于%*在Go中不可用,我们需要探索其他策略来达到忽略字段的目的。
2. 策略一:声明临时变量并忽略其值
最直接且通用的方法是为需要忽略的字段声明一个临时变量,将解析结果存储到该变量中,然后在后续代码中不使用这个变量。这种方法虽然会占用一些内存,但对于少量需要忽略的字段而言,其简单性和可读性是最高的。
示例代码:
立即学习“go语言免费学习笔记(深入)”;
假设我们有一个字符串"interface0 123 456 789",我们只想获取第一个字段(字符串)和最后一个字段(整数),而忽略第二个和第三个整数。
package main
import (
"fmt"
)
func main() {
str := "interface0 123 456 789"
var name string
var val1, val2, val3 int // val1 和 val2 将被忽略
// 使用 fmt.Sscanf 解析字符串
// val1 和 val2 接收被忽略的字段
c, err := fmt.Sscanf(str, "%s %d %d %d", &name, &val1, &val2, &val3)
if err != nil {
fmt.Printf("解析错误: %v\n", err)
return
}
if c != 4 { // 成功解析了4个字段
fmt.Printf("期望解析4个字段,实际解析了%d个\n", c)
return
}
fmt.Printf("获取到的名称: %s\n", name)
fmt.Printf("获取到的最后一个值: %d\n", val3)
// val1 和 val2 的值被成功读取,但我们选择不使用它们
fmt.Printf("被忽略的值 (仅供演示): val1=%d, val2=%d\n", val1, val2)
}注意事项:
- 确保为每个需要忽略的字段提供了正确的类型动词(例如%d对应整数,%s对应字符串)。
- 临时变量的类型应与被忽略字段的实际类型匹配,以避免解析错误。
3. 策略二:使用通用动词%v处理未知类型或简单跳过
如果被忽略的字段类型不确定,或者我们只想简单地跳过一个由空格分隔的令牌,可以使用%v通用动词。%v会尝试以其默认格式读取任何值。
示例代码:
立即学习“go语言免费学习笔记(深入)”;
继续上面的例子,如果中间两个字段的类型可能不是整数,或者我们不关心它们的具体类型。
package main
import (
"fmt"
)
func main() {
str := "interface0 some_text 45.67 789" // 假设中间字段是字符串和浮点数
var name string
var ignored1, ignored2 interface{} // 使用 interface{} 接收任意类型
var val3 int
// 使用 %v 动词来匹配并忽略中间的字段
c, err := fmt.Sscanf(str, "%s %v %v %d", &name, &ignored1, &ignored2, &val3)
if err != nil {
fmt.Printf("解析错误: %v\n", err)
return
}
if c != 4 {
fmt.Printf("期望解析4个字段,实际解析了%d个\n", c)
return
}
fmt.Printf("获取到的名称: %s\n", name)
fmt.Printf("获取到的最后一个值: %d\n", val3)
fmt.Printf("被忽略的值 (仅供演示): ignored1=%v, ignored2=%v\n", ignored1, ignored2)
}注意事项:
- %v适用于匹配任何由空格分隔的令牌。
- 如果需要忽略的字段是固定类型,使用具体类型动词(如%d, %s)通常更精确。
- 此方法同样需要声明临时变量。
4. 策略三:利用interface{}切片进行批量字段忽略(适用于序列数据)
当需要从一系列相同类型(例如整数)的字段中,选择性地获取部分字段并忽略大部分时,可以结合fmt.Scan(或fmt.Sscan)和interface{}切片来实现更优雅的字段忽略。这种方法通过将不需要的字段的指针都指向一个“哑变量”,从而实现批量忽略。
示例代码:
立即学习“go语言免费学习笔记(深入)”;
假设我们有一行包含5个整数的输入,我们只想获取第一个和第三个整数,忽略其他。
package main
import (
"fmt"
"strings"
)
func main() {
input := "10 20 30 40 50" // 假设有5个整数
// 1. 定义一个切片来存储我们真正关心的值
// 假设我们关心第一个和第三个值
vals := make([]int, 2) // 存储两个我们关心的值
// 2. 创建一个 interface{} 切片,用于传递给 fmt.Sscan
// 这个切片的长度应该等于输入中字段的总数
scanArgs := make([]interface{}, 5)
// 3. 定义一个哑变量,所有被忽略的字段的指针都将指向它
ignored := 0
// 4. 遍历 scanArgs,将指针分配给 vals 中的元素或 ignored 变量
// 索引 0 对应 vals[0] (第一个我们关心的值)
// 索引 2 对应 vals[1] (第三个我们关心的值)
for i := 0; i < len(scanArgs); i++ {
switch i {
case 0: // 第一个字段,存储到 vals[0]
scanArgs[i] = &vals[0]
case 2: // 第三个字段,存储到 vals[1]
scanArgs[i] = &vals[1]
default: // 其他字段,指向 ignored 变量
scanArgs[i] = &ignored
}
}
// 5. 使用 fmt.Sscan 进行解析
// strings.NewReader(input) 创建一个 Reader,以便 fmt.Fscan 可以从字符串读取
_, err := fmt.Fscan(strings.NewReader(input), scanArgs...)
if err != nil {
fmt.Printf("解析错误: %v\n", err)
return
}
fmt.Printf("获取到的第一个值: %d\n", vals[0]) // 10
fmt.Printf("获取到的第三个值: %d\n", vals[1]) // 30
fmt.Printf("被忽略的值 (仅供演示): ignored=%d\n", ignored) // 最后一次被赋值的被忽略值
}工作原理:
- fmt.Scan或fmt.Sscan接受一个可变参数列表,每个参数都应该是对应字段的指针。
- 我们构建一个interface{}切片,其中每个元素都是一个指针。
- 对于我们关心的字段,我们将vals切片中对应元素的地址赋值给scanArgs。
- 对于我们不关心的字段,我们将一个共同的ignored变量的地址赋值给scanArgs。这样,所有被忽略的字段都会覆盖ignored变量的值,而不会影响我们真正关心的vals切片。
优点:
- 对于需要从长序列中选择性提取数据的场景,代码结构更清晰。
- 避免了为每个被忽略字段都声明一个独立的临时变量。
注意事项:
- 此方法适用于输入字段数量固定且类型一致(或至少可以被相同的动词解析)的场景。
- fmt.Scan系列函数默认使用空格作为分隔符。
5. 总结
在Go语言中,由于fmt包不支持C语言scanf的%*赋值抑制符,我们需要采用其他策略来忽略fmt.Sscanf或fmt.Scanf中的特定字段。
- 声明临时变量并忽略其值:这是最简单直接的方法,适用于少量字段的忽略,只需为每个不需要的字段声明一个变量来接收解析结果,然后不使用该变量即可。
- 使用通用动词%v:当字段类型不确定或仅需跳过一个由空格分隔的令牌时,可以使用%v配合临时变量。
- 利用interface{}切片:对于需要从固定长度的序列中选择性提取数据(尤其是相同类型的数据)的场景,通过构建interface{}切片,并将不需要的字段的指针指向一个共同的“哑变量”,可以实现更优雅的批量字段忽略。
选择哪种策略取决于具体的解析需求、被忽略字段的数量和类型,以及对代码简洁性的偏好。在实际开发中,如果fmt.Sscanf的灵活性不足,或者输入结构更复杂,也可以考虑使用strings.Split结合strconv包进行手动解析,以获得更细粒度的控制。










