
本文深入探讨 go 语言中 goroutine 的调度机制,解释为何在多 goroutine 场景下,实际的并行执行行为可能与预期不符。我们将阐明 go 运行时调度器的工作原理,特别是 gomaxprocs 参数对并发与并行执行的影响,并提供实践建议以实现更有效的并行处理。
1. Goroutine 与 Go 并发模型概述
Go 语言通过 Goroutine 提供了一种轻量级的并发机制。Goroutine 是由 Go 运行时管理的协程,相比传统的操作系统线程,它具有更小的内存开销和更快的创建、切换速度。当使用 go 关键字启动一个函数时,它就会在一个新的 Goroutine 中异步执行。
理解 Go 的并发模型,首先要区分“并发”(Concurrency)和“并行”(Parallelism):
- 并发:指能够同时处理多个任务的能力,即使这些任务并非在同一时刻执行。它们可能在单个处理器核心上通过时间片轮转的方式交替执行。
- 并行:指多个任务在多个处理器核心上真正地同时、同步执行。
Go 语言天生支持并发,但要实现真正的并行则需要满足一定的条件。
2. Go 运行时调度器的工作原理
Go 运行时包含一个复杂的调度器,负责将 Goroutine 映射到操作系统线程上执行。这个调度器采用了 M:N 调度模型,即 N 个 Goroutine 可以在 M 个操作系统线程上运行。其核心组件包括:
- G (Goroutine):Go 应用程序中的并发执行单元。
- M (Machine/OS Thread):操作系统线程,是实际执行代码的载体。
- P (Processor):逻辑处理器,代表一个 Go 运行时上下文,它将 G 绑定到 M 上。每个 P 维护一个本地的 Goroutine 队列,当 M 完成当前 G 的执行后,会从 P 的队列中取出下一个 G 执行。当 P 的本地队列为空时,它会尝试从其他 P 的队列中“偷取” Goroutine。
2.1 GOMAXPROCS 的作用
GOMAXPROCS 是一个环境变量,也可以通过 runtime.GOMAXPROCS 函数在程序中设置。它控制了 Go 运行时可以同时使用的逻辑处理器 P 的数量。
- 默认值:在 Go 1.5 版本及之后,GOMAXPROCS 的默认值通常设置为机器的 CPU 核心数 (runtime.NumCPU())。但在更早的版本中或某些特定环境下,其默认值可能为 1。
- GOMAXPROCS = 1 的影响:当 GOMAXPROCS 设置为 1 时,即使系统拥有多个 CPU 核心,Go 运行时也只会创建一个逻辑处理器 P。这意味着所有 Goroutine 都必须在一个操作系统线程(M)上轮流执行。在这种情况下,Goroutine 之间只能实现并发,而无法实现真正的并行执行。它们会分时共享 CPU 资源,表现为交替执行。
- GOMAXPROCS > 1 的影响:当 GOMAXPROCS 设置为大于 1 的值时,Go 运行时会创建相应数量的逻辑处理器 P。这些 P 可以被多个操作系统线程 M 使用,从而允许 Goroutine 在多个 CPU 核心上同时执行,实现并行。
3. 实验现象分析:为何并行执行不如预期?
在提供的实验代码中,用户启动了两个计算密集型(CPU 密集型)的 Goroutine,每个 Goroutine 都重复调用 fib 函数。观察到的现象是,在大部分时间内,两个 Goroutine 都是以大块的形式交替执行,而不是预期的“并排”或细粒度交错执行,直到任务后期才出现更频繁的切换。
这种现象通常是 GOMAXPROCS 默认值为 1 时的一个典型表现。当 GOMAXPROCS=1 时:
- 单线程执行:Go 运行时只有一个逻辑处理器 P,所有 Goroutine 都在这一个 P 绑定的 M(操作系统线程)上执行。
- 长时间占用 CPU:fib 函数是一个纯粹的 CPU 密集型计算,它不会主动进行 I/O 操作,也不会调用 runtime.Gosched() 等函数来主动让出 CPU。这意味着一个 Goroutine 一旦开始执行 fib 计算,它会尽可能长时间地占用 CPU,直到被 Go 调度器强制抢占(preemption)。
- 抢占式调度:Go 调度器在 Goroutine 运行时会定期进行抢占检查。在 Go 1.14 之前,抢占主要发生在函数调用或循环的后向跳转点。从 Go 1.14 开始,Go 引入了非协作式抢占(asynchronous preemption),使得调度器可以在任意安全点抢占 Goroutine。然而,即使有了抢占,对于长时间运行的 CPU 密集型任务,调度器也可能允许一个 Goroutine 运行相当长一段时间,直到达到抢占点或时间片耗尽。
- “后期交错”现象:至于为何在任务后期出现更频繁的交错,这可能与 fib 函数在计算较大数字时所需的执行时间有关,或者仅仅是调度器在特定时刻的决策。调度器的行为是非确定性的,它会根据内部启发式算法和系统负载来决定何时切换 Goroutine。在 CPU 密集型任务中,如果一个 Goroutine 不主动让出 CPU,调度器倾向于让它运行一段时间,以减少上下文切换的开销。
4. 实现真正的并行执行
要让 Goroutine 在多核 CPU 上实现真正的并行执行,关键在于确保 Go 运行时能够利用多个逻辑处理器 P。最直接的方法是设置 GOMAXPROCS。
4.1 设置 GOMAXPROCS
你可以通过以下两种方式设置 GOMAXPROCS:
-
通过代码设置 (推荐): 在 main 函数的开头调用 runtime.GOMAXPROCS 函数。通常,我们会将其设置为机器的 CPU 核心数,以充分利用硬件资源。
package main import ( "fmt" "runtime" "sync" // 用于等待 Goroutine 完成 ) // fib 计算第 n 个斐波那










