应按行优先顺序用一维切片模拟二维布局并遍历,控制结构体字段从大到小排列以减少填充,复用对象避免高频分配与逃逸,批量处理减少循环内分支与函数调用。

按顺序访问数据,优先使用一维切片
CPU缓存以缓存行(通常64字节)为单位加载数据。如果代码频繁跳转访问不连续的内存地址,会导致大量缓存行被反复换入换出。Go中应尽量避免嵌套结构体或二维切片的跨行遍历。例如,处理矩阵时,用一维切片模拟二维布局(data[i*cols + j]),并按行优先顺序遍历(外层i,内层j),确保内存访问呈线性。相比[][]float64,一维[]float64不仅减少指针间接寻址,还提升空间局部性。
控制结构体字段排列,减少填充字节
Go编译器按字段声明顺序和大小对齐规则布局结构体。若小字段(如bool、int8)夹在大字段(如int64、[16]byte)之间,会在中间插入填充字节,浪费缓存空间。建议将相同或相近大小的字段归类,并按从大到小排序。例如:
// 优化前:占用24字节(含8字节填充)
type Bad struct {
a int8
b int64
c bool
}
// 优化后:占用17字节(仅1字节填充)
type Good struct {
b int64
c bool
a int8
}
立即学习“go语言免费学习笔记(深入)”;
复用对象,避免高频分配与逃逸
频繁make或new会增加堆分配压力,导致对象分散、缓存行利用率低。对短期使用的临时切片或结构体,优先考虑栈分配或对象池。例如,HTTP handler中可复用bytes.Buffer或预分配足够容量的[]byte;对固定尺寸结构体(如网络包头),使用sync.Pool回收再利用。同时用go tool compile -gcflags="-m"检查变量是否逃逸——未逃逸的变量在栈上分配,天然具备良好局部性。
批量处理,减少循环内部分支与函数调用
每次循环迭代中的条件判断、接口调用或闭包调用都可能打断指令流水线,间接影响数据预取效率。应合并逻辑,展开小循环,内联热路径函数。例如,遍历切片做简单计算时,避免在循环体内调用非内联函数;对已知长度的批量操作,可用常量展开(如处理4个元素一组),让编译器更好向量化或生成紧凑指令。另外,启用GOEXPERIMENT=loopvar(Go 1.22+)可改善循环变量语义,帮助编译器更准确分析内存访问模式。










