使用go test -bench可对比算法性能,需编写规范的Benchmark函数,以Benchmark开头并接收*testing.B参数,在循环中执行被测代码。函数命名应体现算法差异,如BenchmarkSearchLinear与BenchmarkSearchBinary。初始化操作应放在b.ResetTimer()前或用b.StopTimer()/b.StartTimer()控制计时范围,避免干扰结果。调用b.ReportAllocs()以获取内存分配数据。为确保公平,所有测试应使用相同预生成数据、相同环境和编译条件,可通过全局变量或init()初始化。运行时设置GOGC=off减少GC影响,固定CPU频率提升稳定性。建议多次运行(-count=5)取中位数,并结合-benchmem查看内存表现。输出中ns/op表示每次操作耗时,B/op为分配字节数,allocs/op为分配次数,均越低越好。后缀数字代表GOMAXPROCS值,影响并发性能。进阶用法包括生成CPU和内存profile进行热点分析,使用benchstat工具对比测试结果显著性,以及通过b.Run划分不同输入规模,观察性能随数据量变化趋势。关键细节在于控制变量,否则可能误测setup代码而非算法本身。

直接用 go test -bench 就能对比不同算法的性能,关键在于写好 Benchmark 函数、控制变量、看懂 ns/op 和内存分配数据。
写规范的 Benchmark 函数
Benchmark 函数必须以 Benchmark 开头,参数是 *testing.B,且必须在循环中调用待测代码(b.N 次)。Go 会自动调整 b.N 让测试时间稳定在约 1 秒。
- 函数名体现算法差异,比如
BenchmarkSearchLinear和BenchmarkSearchBinary - 避免在循环内做初始化(如建切片、开 map),应提至
b.ResetTimer()前;若必须初始化,用b.StopTimer()/b.StartTimer()控制计时范围 - 别忘了
b.ReportAllocs(),它会显示每次操作的内存分配次数和字节数
确保公平对比的要点
相同输入、相同环境、相同编译条件,才能看出算法本身差异。
- 所有 Benchmark 函数使用同一份预生成数据(如全局变量或
init()初始化),避免每次生成带来额外开销 - 禁用 GC 干扰:运行时加
GOGC=off(如GOGC=off go test -bench=.),尤其当算法涉及大量短生命周期对象时 - 固定 CPU 频率(Linux 下可设
cpupower frequency-set -g performance),避免动态调频影响结果稳定性 - 单次运行可能有波动,用
-count=5多次运行取中位数,再配合-benchmem查看内存表现
解读 benchmark 输出的关键指标
执行 go test -bench=. -benchmem 后,输出类似:
立即学习“go语言免费学习笔记(深入)”;
BenchmarkSearchLinear-8 10000000 124 ns/op 0 B/op 0 allocs/op BenchmarkSearchBinary-8 20000000 62.1 ns/op 0 B/op 0 allocs/op
-
124 ns/op:每次操作平均耗时 124 纳秒,数值越小越快 -
0 B/op:每次操作分配 0 字节内存,越少越好;高分配常意味着频繁 GC 压力 -
0 allocs/op:每次操作零次内存分配,比字节数更反映逃逸和堆分配行为 - 后缀
-8表示 GOMAXPROCS=8,多核并行能力也会影响结果,必要时用GOMAXPROCS=1测试单核表现
进阶技巧:定位性能瓶颈
单纯看 ns/op 不够,需结合工具深挖原因。
- 用
go test -bench=. -cpuprofile=cpu.out生成 CPU profile,再用go tool pprof cpu.out分析热点函数 - 对内存敏感场景,加
-memprofile=mem.out -memprofilerate=1抓内存分配栈 - 用
benchstat(go install golang.org/x/perf/cmd/benchstat@latest)对比多次测试结果,自动判断性能提升是否显著(如benchstat old.txt new.txt) - 写
Benchmark时可嵌套子测试(b.Run),按输入规模分组(如1e3,1e5,1e6),观察算法随数据量增长的变化趋势
基本上就这些。不复杂但容易忽略细节,尤其是初始化位置和 GC 干扰——一不留神,测的就不是算法,而是你的 setup 代码了。











