c++++11引入的内存序是为了在多线程环境中实现更精细的原子操作控制,常用内存序包括:1. memory_order_relaxed,仅保证原子性,适用于独立计数场景;2. memory_order_release与memory_order_acquire,成对使用确保线程间数据同步,如生产者-消费者模型;3. memory_order_acq_rel,兼具获取和释放语义,用于读写操作兼具的原子操作;4. memory_order_seq_cst,默认且最强的顺序一致性,适合逻辑清晰的并发代码;5. memory_order_consume,较少使用,用于依赖链优化。选择时需权衡同步强度与性能。

C++11引入的内存序(memory order)主要是为了支持多线程环境下的原子操作,让开发者能够更精细地控制内存访问顺序,从而在性能和正确性之间取得平衡。常用的有六种:memory_order_relaxed、memory_order_consume、memory_order_acquire、memory_order_release、memory_order_acq_rel 和 memory_order_seq_cst。

下面我们就来逐一看看它们各自的作用和适用场景。

memory_order_relaxed:最宽松的内存序
这是最“自由”的一种内存顺序,它只保证了原子性,不提供任何同步或顺序约束。也就是说,对同一个变量的操作是有序的,但对其他变量的操作可能会被重排。
立即学习“C++免费学习笔记(深入)”;
适用场景:

- 计数器递增,比如统计调用次数。
- 不需要与其他线程交互顺序的简单操作。
例子:
std::atomiccounter(0); counter.fetch_add(1, std::memory_order_relaxed);
在这个例子中,我们只是递增计数器,不需要关心其他变量是否已经更新,所以使用 relaxed 是合适的。
memory_order_release 与 memory_order_acquire:成对使用的同步机制
这两个内存序通常配对使用,用于实现线程间的数据同步。
-
memory_order_release:用于写操作,确保当前线程中所有之前的读写操作不会被重排到该操作之后。 -
memory_order_acquire:用于读操作,确保当前线程中所有之后的读写操作不会被重排到该操作之前。
常见用途:
- 实现简单的生产者-消费者模型。
- 控制共享资源的状态变更。
示例:
std::atomicready(false); int data = 0; // 线程A:写入数据并设置ready为true data = 42; ready.store(true, std::memory_order_release); // 线程B:等待ready变为true后读取data while (!ready.load(std::memory_order_acquire)) { // 等待 } assert(data == 42); // 这里能保证data已经被写入
在这个例子中,release 和 acquire 配合使用,保证了 data 的写入发生在 ready 变为 true 之前,并且读线程能看到完整的更新。
memory_order_acq_rel:兼具获取与释放语义
这个内存序用于同时具有读和写的原子操作(如 fetch_add、exchange 等),它的含义是:
- 对当前原子变量的写操作具有 release 语义;
- 对当前原子变量的读操作具有 acquire 语义。
典型应用:
- 多线程中修改一个标志位的同时读取旧值。
- 实现锁或信号量等同步结构。
例子:
std::atomicflag(0); int old_val = flag.fetch_or(1, std::memory_order_acq_rel);
这里 fetch_or 是个读写操作,acq_rel 确保在修改 flag 值的时候,前面的操作不会被重排到后面,同时也防止后续操作被提前执行。
memory_order_seq_cst:默认也是最强的内存序
这是 C++11 中默认的内存顺序,全称是 sequentially consistent,意思是所有线程看到的都是一个统一的全局顺序。
特点:
- 所有操作都按程序顺序执行。
- 提供最强的同步保证。
- 性能开销最大,因为要维护全局顺序。
适合场景:
- 要求逻辑清晰、容易推理的并发代码。
- 初学者写并发程序时首选。
缺点:
- 在某些平台上会强制插入内存屏障(memory barrier),影响性能。
memory_order_consume:几乎没人用的内存序
这个是最少见也最难理解的一个内存序。它的设计初衷是为了允许在依赖链上进行优化,即如果某个读操作的结果被用来访问另一个变量,那么可以仅同步这条依赖路径上的变量。
但在实际中:
- 很难正确使用。
- 编译器和CPU的支持有限。
- 大多数人建议直接用 acquire 替代。
总的来说,这六种内存序各有各的用途,从松散到严格依次是:
relaxed
选择时要根据具体需求权衡同步强度与性能。像 seq_cst 虽然安全但代价高,而 relaxed 虽快但容易出错。中间几种则更适合高级用户,在特定场景下提升效率。
基本上就这些。









