Go 并发模式：使用 WaitGroup 和通道避免死锁

霞舞

发布时间：2025-11-09 11:20:26

854人浏览过

来源于php中文网

原创

go 并发模式：使用 waitgroup 和通道避免死锁

本文深入探讨了Go语言中N个worker goroutine与一个监控goroutine协调时常见的死锁问题。通过分析`sync.WaitGroup`和通道（channel）的不当使用，文章提供了两种有效的解决方案：一是通过在所有worker完成后关闭通道，使接收方优雅退出；二是在打印逻辑也由单独goroutine处理时，引入额外的同步通道来确保主程序正确终止，从而避免`all goroutines are asleep - deadlock`。

在Go语言的并发编程中，goroutine、channel和sync.WaitGroup是实现高效并发模式的核心工具。然而，不恰当的使用方式，尤其是通道的生命周期管理，很容易导致程序进入死锁状态，并抛出all goroutines are asleep - deadlock的错误。本教程将通过一个经典的“生产者-消费者”场景，深入分析这类死锁的成因，并提供两种健壮的解决方案。

理解死锁问题：监控 Goroutine 的无限等待

考虑一个常见的并发场景：有N个工作（worker）goroutine负责生产数据并发送到一个共享通道，一个监控（monitor）goroutine负责从该通道接收并处理数据，而主程序需要等待所有工作和监控任务完成后才退出。

以下是一个可能导致死锁的初始代码示例：

package main

import (
    "fmt"
    "strconv"
    "sync"
)

func worker(wg *sync.WaitGroup, cs chan string, i int) {
    defer wg.Done()
    cs <- "worker" + strconv.Itoa(i)
}

func monitorWorker(wg *sync.WaitGroup, cs chan string) {
    defer wg.Done()
    for i := range cs { // 此处会无限等待
        fmt.Println(i)
    }
}

func main() {
    wg := &sync.WaitGroup{}
    cs := make(chan string)

    // 启动10个worker goroutine
    for i := 0; i < 10; i++ {
        wg.Add(1)
        go worker(wg, cs, i)
    }

    // 启动一个monitorWorker goroutine
    wg.Add(1)
    go monitorWorker(wg, cs)

    // 等待所有goroutine完成
    wg.Wait()
}

问题分析：

上述代码中，main函数启动了10个worker goroutine和一个monitorWorker goroutine。worker goroutine将数据发送到cs通道，并在完成后调用wg.Done()。monitorWorker goroutine通过for i := range cs循环从通道cs接收数据。

死锁发生的原因在于：

所有worker goroutine完成任务后，都已将数据发送到cs通道并调用了wg.Done()。
此时，monitorWorker goroutine的for i := range cs循环会继续尝试从cs通道接收数据。由于没有其他goroutine会再向cs发送数据，并且cs通道从未被关闭，monitorWorker将无限期地阻塞在此处。
main函数调用wg.Wait()，它在等待monitorWorker goroutine调用wg.Done()。但monitorWorker被阻塞，无法执行defer wg.Done()。
最终，程序中所有可运行的goroutine（除了main函数，monitorWorker被阻塞）都已完成或处于休眠状态，导致Go运行时检测到死锁并报错all goroutines are asleep - deadlock。

解决方案一：通过专用 Goroutine 关闭通道

解决此问题的关键在于，当所有发送方完成任务后，必须关闭通道cs，以通知接收方monitorWorker（或main函数中的for range循环）不再有数据会到来，从而使其优雅地退出循环。

我们可以引入一个专门的monitorWorker goroutine来负责等待所有worker完成，然后关闭cs通道。而数据接收和打印的逻辑则可以放在main函数中。

XPaper Ai

AI撰写论文、开题报告生成、AI论文生成器尽在XPaper Ai论文写作辅助指导平台

下载

package main

import (
    "fmt"
    "strconv"
    "sync"
)

func worker(wg *sync.WaitGroup, cs chan string, i int) {
    defer wg.Done()
    cs <- "worker" + strconv.Itoa(i)
}

// 新的monitorWorker职责：等待所有worker完成，然后关闭通道
func monitorWorker(wg *sync.WaitGroup, cs chan string) {
    wg.Wait() // 等待所有worker goroutine完成
    close(cs) // 所有worker完成后，关闭通道cs
}

func main() {
    wg := &sync.WaitGroup{}
    cs := make(chan string)

    // 启动10个worker goroutine
    for i := 0; i < 10; i++ {
        wg.Add(1)
        go worker(wg, cs, i)
    }

    // 启动一个专门的monitorWorker来关闭通道
    go monitorWorker(wg, cs) // 注意：这里不再将monitorWorker添加到wg中

    // main goroutine负责从通道接收并打印数据
    for i := range cs { // 当cs通道被关闭时，此循环将自动退出
        fmt.Println(i)
    }

    // main函数在此处退出，程序结束
}

方案分析：

worker goroutine照常发送数据并调用wg.Done()。
新的monitorWorker goroutine在启动后，立即调用wg.Wait()。它会阻塞直到所有worker goroutine都调用了wg.Done()。
一旦wg.Wait()返回，意味着所有worker都已完成，monitorWorker随即调用close(cs)关闭通道。
main函数中的for i := range cs循环会持续接收数据，直到cs通道被monitorWorker关闭。通道关闭后，for range循环会自动终止。
main函数在循环结束后自然退出，程序正常终止，避免了死锁。

注意事项：

monitorWorker goroutine没有被添加到main函数的wg中，因为它不是一个需要main等待其完成的“工作”；它的职责是作为协调者，在worker完成后关闭通道。
只有发送方才能关闭通道。 在本例中，虽然monitorWorker不是数据的直接发送方，但它通过wg.Wait()确保了所有发送方都已完成发送，因此它作为协调者来关闭通道是安全的。

解决方案二：多 Goroutine 协调与额外同步通道

如果业务需求坚持将数据接收和打印逻辑也放在一个独立的goroutine中（例如，printWorker），那么我们需要更复杂的同步机制来确保main函数在所有数据处理完毕后才退出。

package main

import (
    "fmt"
    "strconv"
    "sync"
)

func worker(wg *sync.WaitGroup, cs chan string, i int) {
    defer wg.Done()
    cs <- "worker" + strconv.Itoa(i)
}

// 职责同解决方案一：等待所有worker完成，然后关闭通道
func monitorWorker(wg *sync.WaitGroup, cs chan string) {
    wg.Wait()
    close(cs)
}

// 独立的打印goroutine，负责从cs接收并打印数据
func printWorker(cs <-chan string, done chan<- bool) {
    for i := range cs {
        fmt.Println(i)
    }
    // 当cs通道关闭且所有数据处理完毕后，向done通道发送信号
    done <- true
}

func main() {
    wg := &sync.WaitGroup{}
    cs := make(chan string)

    // 启动10个worker goroutine
    for i := 0; i < 10; i++ {
        wg.Add(1)
        go worker(wg, cs, i)
    }

    // 启动monitorWorker来关闭cs通道
    go monitorWorker(wg, cs)

    // 创建一个用于printWorker通知main完成的通道
    done := make(chan bool, 1) // 使用带缓冲的通道，避免printWorker阻塞
    // 启动printWorker goroutine
    go printWorker(cs, done)

    // main goroutine等待printWorker完成的信号
    <-done // 阻塞直到从done通道接收到信号
}

方案分析：

worker goroutine和monitorWorker goroutine的功能与解决方案一相同。monitorWorker在所有worker完成后关闭cs通道。
printWorker goroutine负责从cs通道接收并打印数据。当cs通道被关闭，且所有已发送的数据都被printWorker消费完毕后，printWorker的for range循环会终止。
printWorker在循环终止后，向done通道发送一个true值。
main函数通过

关键点：

done := make(chan bool, 1)：done通道被创建为带缓冲的（容量为1）。这确保了printWorker在发送true到done时不会因为main尚未准备好接收而阻塞，从而避免了潜在的死锁或竞态条件。
这种模式在需要更细粒度的goroutine协调时非常有用，它允许不同的goroutine在完成各自任务后，通过通道向其他goroutine发出信号。

总结与最佳实践

解决Go并发编程中的死锁问题，特别是all goroutines are asleep - deadlock，核心在于对goroutine生命周期和通道状态的精确管理。

通道的关闭是关键： 当不再有数据发送到通道时，必须关闭该通道（close(channel)），以通知所有接收方for range循环可以安全退出。
谁来关闭通道： 只有发送方（或能确认所有发送方已完成的协调者）才能关闭通道。关闭一个已经关闭的通道会导致panic。从一个已关闭的通道接收数据会立即返回零值，并且第二个返回值（ok）为false。
sync.WaitGroup 的作用： WaitGroup主要用于等待一组goroutine完成。在上述示例中，它被用来等待所有worker goroutine完成。
明确的同步信号： 当一个goroutine的完成需要通知另一个goroutine（尤其是main函数）时，使用一个额外的通道进行信号传递是一种健壮的模式。
避免无限等待： 仔细检查for range循环在通道上的使用。如果通道永远不会关闭，for range将导致无限期阻塞。

通过理解这些原则并应用上述解决方案，您可以有效地构建健壮、高效且无死锁的Go并发程序。

如何在Golang中使用replace优化开发流程_Golang本地替换调试技巧

如何优雅地实现 Go 应用的自动错误恢复与重启机制

Go 程序内存不释放的常见原因与正确排查方法

如何通过接口与组合消除 Go 中游戏对象的更新逻辑重复

Go语言中切片索引错误：encodedCode[i:4] 导致越界的原因解析