Go语言并发批量处理数据_Golang数据处理实战

P粉602998670

发布时间：2026-01-22 08:32:54

590人浏览过

来源于php中文网

原创

应使用信号量限流而非无限制启goroutine，避免OOM；批量写入需拼接多行SQL而非单条执行；优先切片分片而非channel传数据；错误需计数、重试、记录，不可忽略或fatal。

go语言并发批量处理数据_golang数据处理实战

并发控制用 `semaphore` 而不是无限制启 `goroutine`

直接在循环里写 go process(item) 看似简单，但数据量一大就会触发 runtime: out of memory 或系统级资源耗尽。Go 的 goroutine 虽轻量，但每个仍占 2KB+ 栈空间，上万并发瞬间吃光内存。

正确做法是用信号量（如 golang.org/x/sync/semaphore）限流：

sem := semaphore.NewWeighted(int64(maxConcurrency))
var wg sync.WaitGroup
for _, item := range items {
    wg.Add(1)
    go func(i Item) {
        defer wg.Done()
        if err := sem.Acquire(context.Background(), 1); err != nil {
            log.Printf("acquire failed: %v", err)
            return
        }
        defer sem.Release(1)
        process(i)
    }(item)
}
wg.Wait()

maxConcurrency 建议设为 CPU 核心数 × 2～5，具体看 process 是 CPU 密集还是 IO 密集
别漏掉 defer sem.Release(1)，否则后续 goroutine 永远拿不到许可
sem.Acquire 可能阻塞或超时，生产环境建议传带超时的 context

批量写入数据库要避免逐条 `INSERT`

用 go 并发处理数据后直接调 db.Exec("INSERT ...", item.ID, item.Name)，本质是把单条 SQL 放到多个连接里跑——不仅没提升吞吐，还放大了连接池压力和事务开销。

真正高效的批量写法是：先分组，再拼 INSERT INTO ... VALUES (...), (...), (...)，一次提交多行：

立即学习“go语言免费学习笔记（深入）”；

我要服装批发网

由逍遥网店系统修改而成，修改内容如下：前台商品可以看大图功能后台商品在线添加编辑功能（允许UBB）破解了访问统计系统增加整合了更加强大的第三方统计系统（IT学习者v1.6）并且更新了10月份的IP数据库。修正了后台会员订单折扣金额处理错误BUG去掉了会员折扣价这个功能，使用市场价，批发价。这样符合实际的模式，批发价非会员不可看修正了在线编辑无法使用 “代码&rdqu

下载

const batchSize = 100
for i := 0; i < len(items); i += batchSize {
    batch := items[i:min(i+batchSize, len(items))]
    values := make([]interface{}, 0, len(batch)*2)
    placeholders := make([]string, 0, len(batch))
    for _, b := range batch {
        placeholders = append(placeholders, "(?, ?)")
        values = append(values, b.ID, b.Name)
    }
    query := "INSERT INTO users (id, name) VALUES " + strings.Join(placeholders, ", ")
    _, err := db.Exec(query, values...)
    if err != nil {
        log.Printf("batch insert failed: %v", err)
    }
}

MySQL / SQLite 支持单语句多值插入；PostgreSQL 需用 UNNEST 或 pgx.Batch
注意 values 参数顺序必须和 placeholders 严格对应
过大的 batchSize（如 > 1000）可能触发 MySQL 的 max_allowed_packet 限制

`channel` 传数据不如切片传得快，别为了“看起来并发”硬套

常见反模式：itemsCh := make(chan Item, 1000)，然后一个 goroutine 往里塞，多个 goroutine 从 channel 读。这引入了额外的同步开销和内存拷贝，实测比直接切片分段慢 15%～30%。

除非需要动态负载均衡（比如任务耗时差异极大），否则优先用预分片 + 启固定 goroutine：

func splitSlice[T any](s []T, n int) [][]T {
    var chunks [][]T
    for i := 0; i < len(s); i += n {
        end := i + n
        if end > len(s) {
            end = len(s)
        }
        chunks = append(chunks, s[i:end])
    }
    return chunks
}

chunks := splitSlice(items, len(items)/runtime.NumCPU())
var wg sync.WaitGroup
for _, chunk := range chunks {
    wg.Add(1)
    go func(c []Item) {
        defer wg.Done()
        for _, item := range c {
            process(item)
        }
    }(chunk)
}
wg.Wait()

channel 适合做事件通知、结果聚合、或跨 goroutine 协作，不是通用数据搬运工
切片分片后传参，零拷贝（只传指针和长度），cache 局部性更好
如果下游要合并结果，用 sync.Map 或预先分配好结果切片更可控

错误处理不能只靠 `log.Fatal` 或忽略 `err`

并发场景下，一个 goroutine panic 会终止整个程序；而静默忽略 err 会导致数据丢失却毫无感知。

推荐组合策略：失败计数 + 可恢复错误重试 + 不可恢复错误记录后跳过：

var failed atomic.Int64
var mu sync.RWMutex
var errors []error

for _, item := range items {
    go func(i Item) {
        defer func() {
            if r := recover(); r != nil {
                mu.Lock()
                errors = append(errors, fmt.Errorf("panic on %v: %v", i.ID, r))
                mu.Unlock()
                failed.Add(1)
            }
        }()
        if err := processWithRetry(i, 3); err != nil {
            mu.Lock()
            errors = append(errors, fmt.Errorf("fail on %v: %w", i.ID, err))
            mu.Unlock()
            failed.Add(1)
            return
        }
    }(item)
}
// 等待结束后检查 failed.Load() > 0 再决定是否告警

别在 goroutine 里用 log.Fatal，它会杀掉 main goroutine
网络类错误（如 DB timeout）适合指数退避重试；校验失败类错误（如字段为空）应直接跳过
所有错误必须进日志或监控，至少包含 item 关键标识（如 ID、批次号）

实际跑通的关键不在“并发多”，而在“控得住、写得稳、错得明”。很多线上事故，都是漏了信号量释放、批大小越界、或 channel 缓冲区填满后死锁——这些点比语法细节更容易卡住上线节奏。

Go语言如何操作MySQL数据库_Golang数据库实战项目

如何使用Golang实现定时数据备份工具_定期保存文件和数据库

Go初级项目如何操作数据库_Go数据库CRUD实战

如何在 Go 应用中安全、正确地处理 MySQL 用户名等连接参数

如何在 Go 应用中安全、正确地处理 MySQL 用户凭证参数

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何使用Golang fmt包打印调试信息_Golang fmt常用输出方法汇总下一篇：暂无

作者最新文章

搜狗浏览器自动刷新怎么关搜狗浏览器刷新设置说明

2026-01-21 18:41

ie浏览器字体显示异常 ie浏览器显示设置调整

2026-01-21 18:43

豆包AI如何辅助进行每日复盘提炼_输入一天的琐事并要求按收获与反思维度总结

2026-01-21 18:47

夸克浏览器如何恢复关闭页面夸克浏览器历史标签找回方式

2026-01-21 18:48

Windows10系统怎么查看网卡MAC地址_Win10命令getmac /v /fo list

2026-01-21 18:50

谷歌浏览器视频卡顿怎么办谷歌浏览器播放优化方案

2026-01-21 18:56

百度浏览器下载的文件在哪百度浏览器下载目录查看

2026-01-21 18:56

edge浏览器打不开特定网站 edge浏览器兼容性处理

2026-01-21 19:02

搜狗浏览器视频无法播放搜狗浏览器播放问题解决

2026-01-21 19:03

UC浏览器怎么截图 UC浏览器页面截图功能讲解

2026-01-21 19:06

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

golang如何定义变量

golang定义变量的方法：1、声明变量并赋予初始值“var age int =值”；2、声明变量但不赋初始值“var age int”；3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

180

2024.02.23

golang有哪些数据转换方法

golang数据转换方法：1、类型转换操作符；2、类型断言；3、字符串和数字之间的转换；4、JSON序列化和反序列化；5、使用标准库进行数据转换；6、使用第三方库进行数据转换；7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

228

2024.02.23

golang常用库有哪些

golang常用库有：1、标准库；2、字符串处理库；3、网络库；4、加密库；5、压缩库；6、xml和json解析库；7、日期和时间库；8、数据库操作库；9、文件操作库；10、图像处理库。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

340

2024.02.23

golang和python的区别是什么

golang和python的区别是：1、golang是一种编译型语言，而python是一种解释型语言；2、golang天生支持并发编程，而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

209

2024.03.05

golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型，并具有垃圾回收功能的开源编程语言，采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

393

2024.05.21

golang结构体相关大全

本专题整合了golang结构体相关大全，想了解更多内容，请阅读专题下面的文章。

197

2025.06.09

golang相关判断方法

本专题整合了golang相关判断方法，想了解更详细的相关内容，请阅读下面的文章。

191

2025.06.10

golang数组使用方法

本专题整合了golang数组用法，想了解更多的相关内容，请阅读专题下面的文章。

233

2025.06.17

AO3中文版入口地址大全

本专题整合了AO3中文版入口地址大全，阅读专题下面的的文章了解更多详细内容。

2026.01.21

热门下载

网站特效

网站源码

网站素材

前端模板

Go语言并发批量处理数据_Golang数据处理实战

并发控制用 semaphore 而不是无限制启 goroutine

批量写入数据库要避免逐条 INSERT

channel 传数据不如切片传得快，别为了“看起来并发”硬套

错误处理不能只靠 log.Fatal 或忽略 err

并发控制用 `semaphore` 而不是无限制启 `goroutine`

批量写入数据库要避免逐条 `INSERT`

`channel` 传数据不如切片传得快，别为了“看起来并发”硬套

错误处理不能只靠 `log.Fatal` 或忽略 `err`