0

0

如何使用c++的std::atomic实现一个自旋锁(spinlock)? (低延迟同步)

尼克

尼克

发布时间:2026-01-12 01:57:08

|

374人浏览过

|

来源于php中文网

原创

std::atomic 是最简自旋锁的底层支撑,可直接实现基础自旋锁,核心是利用 exchange(true, memory_order_acquire) 的原子性;它不依赖系统调度、避免上下文切换,适合短临界区和极短等待场景。

如何使用c++的std::atomic实现一个自旋锁(spinlock)? (低延迟同步)

std::atomic 是最简自旋锁的底层支撑

直接用 std::atomic 实现基础自旋锁是可行且常见的,核心在于利用其 test_and_set()(即 exchange(true, std::memory_order_acquire))的原子性。它不依赖操作系统调度,避免上下文切换开销,适合短临界区、高争用但等待时间极短的场景。

注意:不能用 std::atomic_flag 以外的类型做“无锁”保证——std::atomic 在所有主流平台(x86-64、ARM64)上都映射为单条 lock xchgldaxr/stlxr 指令,满足自旋锁对原子写+读-修改-写的最低要求。

常见错误是误用 load() + store() 组合替代原子交换:

bool expected = false;
while (!flag.compare_exchange_weak(expected, true, std::memory_order_acquire)) {
    expected = false; // 必须重置,否则 compare_exchange_weak 可能因 ABA 失败后卡住
    _mm_pause();      // 推荐:x86 上提示 CPU 当前在忙等,降低功耗和总线争用
}

memory_order 选错会导致数据竞争或性能反模式

自旋锁的内存序不是“越强越好”。关键点在于:

立即学习C++免费学习笔记(深入)”;

  • 加锁用 std::memory_order_acquire:确保后续临界区读写不会被重排到锁获取之前
  • 解锁用 std::memory_order_release:确保临界区内的写操作对其他线程可见
  • 绝对不要在加锁时用 relaxed —— 会导致临界区指令重排进锁外,破坏同步语义
  • 也不要用 seq_cst —— 在 ARM/PowerPC 上会插入昂贵的全局内存屏障,x86 虽便宜但仍是冗余

典型错误现象:临界区内更新的 int counter 值在其他线程中“偶尔看不到”,其实是编译器或 CPU 将该写操作重排到了 unlock() 之后。

std::atomic_flag 是更轻量、更标准的起点

std::atomic_flag 是 C++ 标准唯一保证“无锁”(lock-free)的原子类型,初始化必须用 ATOMIC_FLAG_INIT(C++17 起可直接用默认构造,但需调用 .clear(std::memory_order_relaxed) 初始化)。

社研通
社研通

文科研究生的学术加速器

下载

它只提供 test_and_set()clear(),语义清晰、体积最小(通常 1 字节),比 std::atomic 更贴近硬件原语:

struct spinlock {
    std::atomic_flag flag = ATOMIC_FLAG_INIT;

    void lock() {
        while (flag.test_and_set(std::memory_order_acquire)) {
            _mm_pause();
        }
    }

    void unlock() {
        flag.clear(std::memory_order_release);
    }
};

使用 std::atomic_flag 的另一个好处是:编译器能更好识别这是自旋行为,某些优化(如循环展开)会被抑制,避免生成低效代码。

真实低延迟场景下必须考虑退避与公平性缺失

纯自旋锁在高争用下会持续占用 CPU 核心,导致:其他线程饿死、温度升高、Turbo Boost 频率下降、实际延迟反而升高。这不是理论风险,而是高频交易或实时音频处理中反复验证的问题。

简单改进是加入指数退避(exponential backoff):

  • 首次失败后 _mm_pause() 1 次
  • 第二次失败后 _mm_pause() 2 次
  • 最多叠加到 64 次后,改用 std::this_thread::yield() 让出时间片

但要注意:yield() 会引入调度延迟(微秒级),破坏“低延迟”前提;而完全不退避又可能让锁持有者无法及时被调度(尤其在负载饱和时)。这个权衡没有银弹,取决于你的临界区平均耗时和系统负载特征。

最后提醒:自旋锁不提供排队机制,线程获得锁的顺序不确定。如果你需要 FIFO 公平性,得上 std::mutex 或基于队列的 ticket lock —— 但那就不再是纯自旋了。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

315

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

534

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

51

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

194

2025.08.29

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

479

2023.08.10

c++主流开发框架汇总
c++主流开发框架汇总

本专题整合了c++开发框架推荐,阅读专题下面的文章了解更多详细内容。

79

2026.01.09

c++框架学习教程汇总
c++框架学习教程汇总

本专题整合了c++框架学习教程汇总,阅读专题下面的文章了解更多详细内容。

46

2026.01.09

学python好用的网站推荐
学python好用的网站推荐

本专题整合了python学习教程汇总,阅读专题下面的文章了解更多详细内容。

121

2026.01.09

学python网站汇总
学python网站汇总

本专题整合了学python网站汇总,阅读专题下面的文章了解更多详细内容。

12

2026.01.09

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Rust 教程
Rust 教程

共28课时 | 4.3万人学习

PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7万人学习

Git 教程
Git 教程

共21课时 | 2.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号