不依赖传统互斥锁的安全累加方法有五种:一、threading.local实现线程私有计数;二、queue.Queue消息传递由单线程汇总;三、Semaphore伪原子累加(依赖私有属性);四、multiprocessing.Value利用底层原子指令;五、numpy+ctypes/numba调用平台原子原语。

如果您在 Python 多线程程序中直接对共享整数变量执行 += 操作,将面临竞态条件导致计数丢失的问题。以下是几种不依赖传统互斥锁(如 threading.Lock)实现安全累加的可行方法:
一、使用 threading.local 实现线程私有计数器
该方法为每个线程分配独立的计数器副本,彻底避免共享冲突,适用于各线程只需维护自身计数值、最终无需全局汇总的场景。
1、导入 threading 模块并创建 local() 实例。
2、在线程函数内部,通过 local 实例的属性访问当前线程专属的计数器变量。
立即学习“Python免费学习笔记(深入)”;
3、对该变量执行任意次数的 += 操作,均不会影响其他线程的值。
4、主线程无法直接读取各线程的 local 计数器,如需汇总,须由各线程主动上报结果。
二、使用 queue.Queue 替代共享变量
将累加操作转化为“发送增量指令”的消息传递过程,由单一线程(通常是主线程)顺序消费并更新全局计数器,消除并发写入。
1、初始化一个 threading.Queue 实例用于承载增量值。
2、每个工作线程计算完本地增量后,调用 queue.put(delta) 将数值入队。
3、主线程启动一个专用消费者循环,持续调用 queue.get() 获取增量并累加到全局变量。
4、所有线程完成任务后,向队列发送结束信号(如 None),消费者检测到后退出循环。
三、使用原子操作类型——threading.Semaphore(伪原子累加)
利用信号量的内部计数器作为累加载体,其 acquire() 与 release() 方法底层由 C 实现且具有原子性,可间接达成安全递增。
1、创建初始值为 0 的 threading.Semaphore(0) 实例。
2、每次需“加 1”时,调用 semaphore.release() —— 此操作原子性地使内部计数器加 1。
3、获取当前总和时,需通过反射访问其私有属性 _value(仅限 CPython 实现,不可跨版本依赖)。
4、注意该方式仅支持整数累加,且 _value 属于未公开 API,运行时行为无保障。
四、使用 multiprocessing.Value(配合 threading)
借助 multiprocessing 模块提供的进程共享内存对象,其内部已封装原子操作,可在多线程中安全读写。
1、创建 multiprocessing.Value('i', 0),指定类型码 'i' 表示有符号整型。
2、各线程调用 value.value += 1 时,底层会触发原子的 CPU 指令(如 x86 的 LOCK XADD)。
3、无需显式加锁,所有线程对 value.value 的写入天然串行化。
4、该对象支持 ctypes 支持的所有基础类型,但仅限于数值类共享变量。
五、使用 numpy.ndarray 配合 atomic 操作(需 numba 或 ctypes 辅助)
纯 Python 中 numpy 数组本身不提供原子性,但可通过 ctypes 绑定到共享内存,并调用平台特定的原子指令实现。
1、分配一块 ctypes.c_int32 类型的共享内存区域。
2、使用 numpy.frombuffer() 将其映射为 int32 数组。
3、借助 numba.njit(parallel=True) 或手写 ctypes 函数调用 OS 提供的原子加法(如 Windows 的 InterlockedAdd,Linux 的 __atomic_fetch_add)。
4、此方案绕过 GIL 且性能极高,但要求开发者熟悉底层原子原语及平台差异。










