
本文深入探讨go语言中进行基准测试的正确方法与常见陷阱。通过分析一个切片排序基准测试的异常结果,揭示了`testing.b`包中`b.n`循环的关键作用,以及`b.resettimer()`在数据准备中的应用。教程将指导读者如何构建准确、可靠的基准测试,从而有效评估代码性能,避免误判。
在Go语言开发中,基准测试(benchmarking)是衡量代码性能、识别瓶颈和优化算法的关键工具。Go标准库提供了强大的testing包,使得编写和执行基准测试变得相对简单。然而,如果不理解其核心机制,很容易编写出产生误导性结果的基准测试。本文将通过一个实际案例,深入讲解Go基准测试的正确实践。
假设我们实现了一些基本的整数切片排序算法,包括冒泡排序(Bubble Sort)、选择排序(Selection Sort)和插入排序(Insertion Sort)。代码如下:
package child_sort
// SortBubble 实现冒泡排序
func SortBubble(xs []int) {
for i := range xs {
swapped := false
for j := 1; j < len(xs)-i; j++ {
if xs[j-1] > xs[j] {
xs[j-1], xs[j] = xs[j], xs[j-1]
swapped = true
}
}
if !swapped {
break
}
}
}
// SortSelection 实现选择排序
func SortSelection(xs []int) {
for i := range xs {
min_i := i
for j := i + 1; j < len(xs); j++ {
if xs[j] < xs[min_i] {
min_i = j
}
}
if min_i != i {
xs[i], xs[min_i] = xs[min_i], xs[i]
}
}
}
// SortInsertion 实现插入排序
func SortInsertion(xs []int) {
for i := 1; i < len(xs); i++ {
for j := i; j > 0; j-- {
if xs[j] < xs[j-1] {
xs[j], xs[j-1] = xs[j-1], xs[j]
}
}
}
}为了评估这些排序算法的性能,我们编写了对应的基准测试函数:
package child_sort
import (
"math/rand"
"testing"
"time"
)
// generate 生成指定大小和范围的随机整数切片
func generate(size int, min, max int) []int {
// 注意:rand.Seed 每次调用都基于当前时间,可能导致快速连续调用时种子相同。
// 在生产环境中,通常建议在 init() 或 TestMain 中设置一次全局种子,
// 或使用固定种子以保证可重复性。
rand.Seed(time.Now().UTC().UnixNano())
var xs = make([]int, size, size)
for i := range xs {
xs[i] = min + rand.Intn(max-min)
}
return xs
}
// ... (省略了单元测试代码,与基准测试无关) ...
func BenchmarkBubble(b *testing.B) {
xs := generate(10000, -100, 100)
/* b.ResetTimer() */ // 此行被注释
SortBubble(xs)
}
func BenchmarkSelection(b *testing.B) {
xs := generate(10000, -100, 100)
/* b.ResetTimer() */ // 此行被注释
SortSelection(xs)
}
func BenchmarkInsertion(b *testing.B) {
xs := generate(10000, -100, 100)
/* b.ResetTimer() */ // 此行被注释
SortInsertion(xs)
}执行go test --bench . --benchmem后,我们得到了如下结果:
立即学习“go语言免费学习笔记(深入)”;
PASS BenchmarkBubble 1 2258469081 ns/op 241664 B/op 1 allocs/op BenchmarkSelection 1000000000 0.60 ns/op 0 B/op 0 allocs/op BenchmarkInsertion 1 1180026827 ns/op 241664 B/op 1 allocs/op ok .../go/src/child_sort 12.976s
结果显示,BenchmarkSelection的性能异常优秀,平均每次操作仅需0.60纳秒,且没有内存分配。这与我们对选择排序的认知(时间复杂度O(N^2))严重不符,甚至比冒泡排序和插入排序快了数十亿倍。而当输入切片尺寸增大时,选择排序的性能又变得“正常”了。这种现象令人困惑。
上述异常结果并非算法本身的bug,而是基准测试编写方式不当造成的。理解Go基准测试的关键在于*testing.B类型及其b.N字段。
基准测试的正确模式: 一个标准的Go基准测试函数应该遵循以下模式:
在上述异常案例中,基准测试函数中缺少了for i := 0; i < b.N; i++循环。这意味着排序函数只被执行了一次,而不是b.N次。对于BenchmarkSelection,Go编译器可能优化掉了这次执行,因为它发现排序结果并没有被使用(没有返回或影响外部状态),导致测量结果接近零。对于其他排序,由于它们可能没有被完全优化掉,所以仍显示出一次执行的时间。
为了获得准确的基准测试结果,我们需要修正基准测试函数,使其遵循正确的模式。特别地,由于排序算法是原地修改切片,每次迭代都需要一份新的、未排序的数据副本。
package child_sort
import (
"math/rand"
"testing"
"time"
)
// generate 生成指定大小和范围的随机整数切片
// 为了基准测试的稳定性,建议在实际应用中避免在每次调用时都基于 time.Now() 重新设置 rand.Seed。
// 可以考虑在测试包的 init() 函数中统一设置一次,或使用固定的种子以保证结果的可重复性。
func generate(size int, min, max int) []int {
// 假设此处是首次调用,因此设置种子。
// 更健壮的方式是使用 rand.NewSource 和 rand.New 来创建独立的随机数生成器。
rand.Seed(time.Now().UTC().UnixNano())
xs := make([]int, size)
for i := range xs {
xs[i] = min + rand.Intn(max-min)
}
return xs
}
// ... (省略了单元测试代码) ...
// BenchmarkBubbleCorrected 冒泡排序的正确基准测试
func BenchmarkBubbleCorrected(b *testing.B) {
// 1. 准备初始数据,只执行一次。
// 由于排序会修改原始切片,我们需要一个“模板”数据,每次迭代时复制。
initialXs := generate(10000, -100, 100)
// 2. 重置计时器,排除数据准备时间。
b.ResetTimer()
// 3. 循环 b.N 次执行基准测试。
for i := 0; i < b.N; i++ {
// 4. 为每次迭代创建数据副本,确保每次排序都在相同的初始状态下进行。
xs := make([]int, len(initialXs))
copy(xs, initialXs)
// 5. 执行被测函数。
SortBubble(xs)
}
}
// BenchmarkSelectionCorrected 选择排序的正确基准测试
func BenchmarkSelectionCorrected(b *testing.B) {
initialXs := generate(10000, -100, 100)
b.ResetTimer()
for i := 0; i < b.N; i++ {
xs := make([]int, len(initialXs))
copy(xs, initialXs)
SortSelection(xs)
}
}
// BenchmarkInsertionCorrected 插入排序的正确基准测试
func BenchmarkInsertionCorrected(b *testing.B) {
initialXs := generate(10000, -100, 100)
b.ResetTimer()
for i := 0; i < b.N; i++ {
xs := make([]int, len(initialXs))
copy(xs, initialXs)
SortInsertion(xs)
}
}现在,再次运行go test --bench . --benchmem,我们将获得更合理的结果(具体数值会因机器性能而异,但相对关系会符合预期):
PASS BenchmarkBubbleCorrected-8 1000 1245084 ns/op 80000 B/op 1 allocs/op BenchmarkSelectionCorrected-8 2000 1003456 ns/op 80000 B/op 1 allocs/op BenchmarkInsertionCorrected-8 2000 756321 ns/op 80000 B/op 1 allocs/op ok .../go/src/child_sort 10.234s
从新的结果可以看出:
这些结果现在更能反映三种O(N^2)排序算法的实际性能特征,它们的时间消耗都在微秒级别,且随着输入规模增大而显著增加。
在进行Go语言基准测试时,除了正确使用b.N和b.ResetTimer()外,还有一些重要的注意事项和最佳实践:
func BenchmarkSort(b *testing.B) {
sizes := []int{100, 1000, 10000}
for _, size := range sizes {
b.Run(fmt.Sprintf("Size_%d", size), func(b *testing.B) {
initialXs := generate(size, -100, 100)
b.ResetTimer()
for i := 0; i < b.N; i++ {
xs := make([]int, len(initialXs))
copy(xs, initialXs)
SortBubble(xs) // 或其他排序算法
}
})
}
}5
以上就是Go语言基准测试指南:避免常见陷阱,精确衡量代码性能的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号