死锁排查需先利用Go运行时检测机制发现阻塞,再通过GODEBUG和pprof分析goroutine状态与调用栈,重点检查channel收发匹配、锁获取顺序一致性,并确保main函数不提前退出,结合工具定位并修正同步逻辑。

死锁是Golang并发编程中常见的问题,通常发生在多个goroutine相互等待对方释放资源时。排查死锁的关键在于理解程序的锁依赖关系和goroutine的执行状态。以下是一些实用的排查方法。
1. 使用Go运行时死锁检测机制
Go的运行时系统会在程序退出时自动检测是否存在仍在阻塞的goroutine,尤其是主函数结束但仍有goroutine未完成的情况。
当发生无法恢复的死锁时,Go会输出类似如下的信息:
fatal error: all goroutines are asleep - deadlock!这表示所有活跃的goroutine都处于等待状态,程序无法继续推进。此时应检查:
立即学习“go语言免费学习笔记(深入)”;
- 是否有goroutine在等待channel读写,但没有对应的发送或接收方
- 是否使用了无缓冲channel且双方都在等待
- main函数是否提前退出,而worker goroutine仍在运行
2. 利用GODEBUG查看调度器状态
通过设置环境变量GODEBUG=schedtrace=1000,可以让Go每秒输出一次调度器的状态信息,帮助判断goroutine是否卡住。
示例命令:
GODEBUG=schedtrace=1000 ./your-program输出中关注:
- gomaxprocs:当前P的数量
- g数量:正在运行或可运行的goroutine数
- 长时间为0可能意味着goroutine全部阻塞
3. 使用pprof分析阻塞情况
导入net/http/pprof包可以启用性能分析接口,其中/debug/pprof/goroutine能列出所有goroutine的调用栈。
步骤如下:
- 在程序中启动一个HTTP服务:
http.ListenAndServe("localhost:6060", nil) - 访问
http://localhost:6060/debug/pprof/goroutine?debug=2 - 查看每个goroutine的堆栈,定位卡在哪个channel操作或锁上
例如看到某goroutine停在chan send或sync.(*Mutex).Lock,就能快速锁定问题点。
4. 检查锁的获取顺序
多个goroutine以不同顺序获取多个互斥锁容易导致死锁。比如:
- Goroutine A先锁lock1,再锁lock2
- Goroutine B先锁lock2,再锁lock1
一旦两个goroutine同时运行并各自持有其中一个锁,就会形成循环等待。解决方法是统一所有地方的加锁顺序。
5. 避免在channel操作中遗漏收发方
常见错误包括:
- 向无缓冲channel发送数据,但没有goroutine接收
- 从channel接收数据,但无人发送且未关闭
- 忘记关闭channel导致range无限等待
建议使用带缓冲的channel或select配合default分支做非阻塞操作,也可使用context控制超时。
基本上就这些。死锁排查重在观察goroutine行为和资源依赖,结合工具定位阻塞点,再根据逻辑修正同步方式。











