
在go语言中,切片(slice)是一种动态数组,它建立在底层数组之上,并提供了对序列的抽象。一个切片包含三个核心组件:指向底层数组的指针、切片的长度(length)以及切片的容量(capacity)。长度是切片当前包含的元素数量,而容量是底层数组从切片起始位置开始能够容纳的最大元素数量。
append函数是Go语言内置的用于向切片追加元素的核心函数。当向切片追加元素时,如果切片的当前容量不足以容纳新元素,append函数就需要进行内存重新分配。这通常涉及到创建一个更大的底层数组,将现有元素拷贝到新数组中,然后将新元素追加到新数组的末尾。
开发者在使用append时常常会疑问:这种重新分配和拷贝操作是否会导致每次append都以线性时间复杂度运行(即每次追加都拷贝所有现有元素)?还是像许多语言中的动态数组(如C++的std::vector)一样,采用摊还常数时间复杂度?
Go语言规范对此有明确说明:
如果切片s的容量不足以容纳附加值,append将分配一个足够大的新切片,以容纳现有切片元素和附加值。因此,返回的切片可能引用不同的底层数组。
这表明重新分配是可能发生的,但具体如何“分配一个足够大的新切片”则留给了实现者。这意味着append的精确行为和性能特性是与具体的Go编译器实现相关的。
立即学习“go语言免费学习笔记(深入)”;
对于Go语言的主流编译器gc,append函数采用了一种“慷慨”的内存增长策略,从而实现了摊还常数时间复杂度。这种策略的核心在于runtime包中的growslice函数。当需要扩容时,growslice的逻辑大致如下:
newcap := old.cap // 初始新容量为旧容量
doublecap := newcap + newcap // 双倍容量
if cap > doublecap { // 如果需要的容量大于双倍容量,则直接使用所需容量
newcap = cap
} else {
if old.len < 1024 { // 如果旧长度小于1024,则容量翻倍
newcap = doublecap
} else { // 如果旧长度大于等于1024,则每次增长1/4
for newcap < cap { // 循环直到新容量满足需求
newcap += newcap / 4
}
}
}从上述代码可以看出gc编译器在扩容时的策略:
这种增长策略确保了尽管偶尔会发生昂贵的重新分配和拷贝操作,但这些操作的频率会随着切片容量的增加而降低,且每次重新分配时增加的容量足够大,能够摊薄后续多次append操作的成本。因此,从长期来看,每次追加元素的平均成本趋近于常数,即摊还常数时间复杂度。
为了更好地理解不同分配策略对容量增长的影响,我们可以编写代码模拟两种极端的append行为:
package main
import "fmt"
// Generous reallocation: 模拟Go gc编译器的扩容策略
func constant(s []int, x ...int) []int {
// 如果当前容量不足以容纳新元素
if len(s)+len(x) > cap(s) {
newcap := len(s) + len(x) // 至少需要的容量
m := cap(s) // 当前容量
// 扩容逻辑与gc growslice类似
if m+m < newcap { // 如果翻倍容量仍不足,直接使用所需容量
m = newcap
} else {
for { // 否则,根据长度进行翻倍或1.25倍增长
if len(s) < 1024 {
m += m // 小于1024时翻倍
} else {
m += m / 4 // 大于等于1024时增长1/4
}
if !(m < newcap) { // 直到新容量满足需求
break
}
}
}
// 创建新切片,拷贝旧数据
tmp := make([]int, len(s), m)
copy(tmp, s)
s = tmp
}
// 确保容量足够后,追加元素(这里为了简化,直接调用内置append)
// 实际实现会直接将x追加到s的底层数组
return append(s, x...)
}
// Parsimonious reallocation: 每次只分配刚好够用的容量
func variable(s []int, x ...int) []int {
// 如果当前容量不足以容纳新元素
if len(s)+len(x) > cap(s) {
// 只分配刚好够用的新容量
tmp := make([]int, len(s), len(s)+len(x))
copy(tmp, s)
s = tmp
}
return append(s, x...)
}
func main() {
s := []int{0, 1, 2}
x := []int{3, 4}
fmt.Println("data ", len(s), cap(s), s, len(x), cap(x), x)
// 初始化三个切片,分别用于测试内置append、慷慨分配和吝啬分配
a, c, v := s, s, s
// 循环追加大量元素
for i := 0; i < 4096; i++ {
a = append(a, x...)
c = constant(c, x...)
v = variable(v, x...)
}
// 打印最终切片的长度和容量
fmt.Println("append ", len(a), cap(a), len(x))
fmt.Println("constant", len(c), cap(c), len(x))
fmt.Println("variable", len(v), cap(v), len(x))
}运行结果(以gc编译器为例):
data 3 3 [0 1 2] 2 2 [3 4] append 8195 9152 2 constant 8195 9152 2 variable 8195 8195 2
从输出可以看出:
吝啬分配策略会导致每次扩容都需要将所有现有元素拷贝到新数组,从而使得每次append操作的复杂度为O(N),整体循环的复杂度为O(N^2)。而慷慨分配策略通过预留空间,将拷贝操作的成本分摊到多次append中,实现了摊还常数时间复杂度。
Go语言的append函数在gc编译器的实现下,通过“慷慨”的内存增长策略(小容量翻倍,大容量增长1.25倍),实现了摊还常数时间复杂度。这意味着尽管在某些时刻会发生昂贵的内存重新分配和数据拷贝,但从平均意义上看,每次追加元素的成本是常数级的,这使得append成为高效构建动态序列的强大工具。理解这一机制并合理利用容量预分配,是编写高性能Go程序的关键。
以上就是深入理解Go语言append函数的计算复杂度的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号