net.Conn 不能并发读写因底层非线程安全,会导致数据错乱或 panic;需用独立 goroutine 分别处理读写并同步;管理用户 map 必须配 sync.RWMutex;bufio.Scanner 需调小缓冲防 ErrTooLong;客户端断连后须原子化清理连接、map 和 channel。

为什么 net.Conn 不能直接在多个 goroutine 里读写
因为 net.Conn 的底层实现(如 TCP 连接)不是并发安全的:同时调用 conn.Read() 或 conn.Write() 可能导致数据错乱、panic 或静默丢包。常见现象是客户端收不到消息,或服务端日志里出现 use of closed network connection 却没主动关闭连接。
典型错误写法是让一个 goroutine 负责读、另一个负责写,但共用同一个 conn 实例又不加同步——Go 的 net.Conn 接口本身不承诺线程安全,这点和 bufio.Scanner 或 json.Encoder 类似。
- 读操作必须独占
conn,建议用单独 goroutine 阻塞调用conn.Read(),把数据发到 channel - 写操作也应集中在一个 goroutine(比如主循环或专门的 writer goroutine),从 channel 拉取消息后统一
conn.Write() - 避免在 handler 中直接
fmt.Fprintln(conn, ...),它内部会调用Write(),和其它写操作竞争
如何用 map 安全管理在线用户列表
直接用全局 map[string]net.Conn 并发读写会 panic:Go 的原生 map 不支持多 goroutine 同时读写。你可能看到 fatal error: concurrent map read and map write。
简单可靠的做法是搭配 sync.RWMutex,而不是过早引入 sync.Map——后者适合读多写少且 key 类型不确定的场景,而聊天室的用户增删频率中等,且 key 是明确的 string(如用户名),RWMutex 更易控制、更易调试。
立即学习“go语言免费学习笔记(深入)”;
- 添加用户:写锁下检查重名 + 存入 map + 广播上线通知
- 广播消息:读锁下遍历 map 值,对每个
conn发送(注意写操作仍需单 goroutine 或带错误处理) - 断开连接:写锁下删除条目,并关闭对应
conn(避免残留)
bufio.Scanner 默认 64KB 缓冲不够,换行读取容易卡住
聊天消息通常较短,但用户粘贴长文本、或输入含大量空格/制表符的段落时,bufio.Scanner 默认的 MaxScanTokenSize = 64 * 1024 会被突破,导致 scanner.Scan() 返回 false,且 scanner.Err() 是 bufio.ErrTooLong ——这个错误很容易被忽略,结果就是连接看似“活着”,实则不再处理新消息。
解决方案不是盲目调大上限,而是按聊天协议约定行为:比如规定单条消息不超过 4KB,然后显式设置:
scanner := bufio.NewScanner(conn) scanner.Buffer(make([]byte, 4096), 4096)
同时记得在读循环里检查错误:
if err := scanner.Err(); err != nil {
log.Printf("scan error from %v: %v", conn.RemoteAddr(), err)
break
}- 不要依赖
scanner.Text()的隐式换行截断;聊天协议应以 \n 或 \r\n 为分隔,否则需自定义SplitFunc - 如果允许二进制消息(如图片 base64),就别用
Scanner,改用conn.Read()配合长度前缀或固定帧格式
客户端断连时,conn.Read() 返回 io.EOF 但服务端没清理资源
这是最隐蔽的资源泄漏点:goroutine 持有 conn 和相关 channel 引用,却因未检测到 EOF 而永不退出,导致 goroutine 和内存持续堆积。线上跑几小时后可能 OOM。
关键不是“怎么检测断连”,而是“检测到之后必须做三件事”:
- 从用户 map 中删除该连接(带锁)
- 关闭该连接的读写:
conn.Close()(防止 fd 耗尽) - 关闭关联的 channel(如用于接收消息的
msgCh),让 writer goroutine 有机会退出
典型结构:
for {
line, err := scanner.Text(), scanner.Err()
if err != nil {
if err == io.EOF || strings.Contains(err.Error(), "broken pipe") {
log.Printf("client %v disconnected", conn.RemoteAddr())
unregisterClient(username) // 包含 map 删除 + conn.Close()
return
}
log.Printf("read error: %v", err)
return
}
// 处理 line...
}真正难的是 unregister 的原子性:必须确保 map 删除、conn 关闭、广播下线通知这三步不被中断,否则会出现“用户已掉线但还在广播列表里”的状态不一致。










