0

0

C++如何使用atomic操作实现自旋锁

P粉602998670

P粉602998670

发布时间:2025-10-12 23:59:01

|

993人浏览过

|

来源于php中文网

原创

自旋锁利用原子操作避免上下文切换开销,适用于短临界区;通过std::atomic_flag实现lock-free的加解锁,结合PAUSE指令优化自旋等待性能,在多核环境下提升效率。

c++如何使用atomic操作实现自旋锁

C++中利用atomic操作实现自旋锁,核心思想是借助原子变量的不可中断性,让线程在一个循环中不断尝试获取锁,直到成功。这种锁机制在多核处理器环境下,对于保护非常短小的临界区代码,可以避免操作系统上下文切换的开销,从而在特定场景下提供更高的性能。

解决方案

实现一个C++自旋锁,我们通常会用到std::atomic_flag或者std::atomicstd::atomic_flag是C++11中最简单的原子类型,它保证是lock-free的,并且只有两个基本操作:test_and_set()clear(),非常适合用来实现自旋锁。

下面是一个基于std::atomic_flag的自旋锁实现:

#include 
#include  // For std::this_thread::yield() or _mm_pause
#include 

// 针对x86/x64平台的_mm_pause指令,用于优化自旋等待
#if defined(__GNUC__) || defined(__clang__)
#define PAUSE_INSTRUCTION() __asm__ __volatile__("pause" ::: "memory")
#elif defined(_MSC_VER)
#include 
#define PAUSE_INSTRUCTION() _mm_pause()
#else
#define PAUSE_INSTRUCTION() /* Fallback for other platforms */
#endif

class SpinLock {
public:
    void lock() {
        // test_and_set()会原子地将flag设置为true,并返回其旧值。
        // 如果旧值为true,说明锁已经被占用,当前线程需要继续自旋。
        // 如果旧值为false,说明成功获取锁。
        while (flag.test_and_set(std::memory_order_acquire)) {
            // 在自旋等待时,加入PAUSE指令可以降低CPU功耗,
            // 减少缓存一致性协议的流量,提高性能。
            // 也可以考虑使用std::this_thread::yield()让出CPU时间片,
            // 但对于短临界区,PAUSE通常更优。
            PAUSE_INSTRUCTION();
        }
    }

    void unlock() {
        // 原子地将flag设置为false,释放锁。
        // memory_order_release确保在释放锁之前,所有对受保护资源的修改都已完成并对其他线程可见。
        flag.clear(std::memory_order_release);
    }

private:
    std::atomic_flag flag = ATOMIC_FLAG_INIT; // 初始化为false(未锁定状态)
};

// 示例用法
// int shared_data = 0;
// SpinLock my_spinlock;

// void increment() {
//     for (int i = 0; i < 100000; ++i) {
//         my_spinlock.lock();
//         shared_data++;
//         my_spinlock.unlock();
//     }
// }

// int main() {
//     std::thread t1(increment);
//     std::thread t2(increment);

//     t1.join();
//     t2.join();

//     std::cout << "Final shared_data: " << shared_data << std::endl;
//     return 0;
// }

这个SpinLock类通过std::atomic_flagtest_and_setclear方法,实现了基本的自旋加锁和解锁逻辑。test_and_set在尝试获取锁时会一直循环,直到成功将flagfalse变为trueclear则将flag重置为false,允许其他线程获取锁。这里特别加入了PAUSE_INSTRUCTION(),这在x86/x64架构上是至关重要的优化,它能显著提升自旋锁的效率和降低CPU功耗。

立即学习C++免费学习笔记(深入)”;

自旋锁与互斥锁:何时选择,为何选择?

在多线程编程中,保护共享资源是永恒的主题,自旋锁和互斥锁(如std::mutex)是两种常见的手段。我个人觉得,理解它们之间的差异和适用场景,远比盲目选择一个“看起来更快”的方案重要。

说白了,互斥锁在无法获取锁时,会把当前线程置于休眠状态,然后由操作系统调度器唤醒。这个过程涉及上下文切换,开销不小。而自旋锁呢,它就“死等”,在一个循环里不断地检查锁是否可用,不休眠,不放弃CPU。

那么,什么时候用自旋锁呢?在我看来,它最适合那些临界区代码执行时间极短,而且线程争用不那么激烈的场景。比如说,你只是修改一个计数器,或者更新一个指针,这些操作可能只需要几十个CPU周期。如果用互斥锁,上下文切换的开销可能比执行临界区代码本身还要大好几倍,那显然不划算。在多核处理器上,如果一个线程短暂地持有锁,另一个线程自旋等待,可能很快就能拿到锁,避免了昂贵的上下文切换。

反之,如果临界区代码执行时间比较长,或者线程争用非常激烈,那么自旋锁就会变成一个“CPU杀手”。它会让等待线程白白消耗CPU资源,而没有做任何有意义的工作。这种情况下,互斥锁让等待线程休眠,把CPU时间让给其他线程去做有用的事情,反而更高效。有时候我会想,很多人一上来就觉得自旋锁“快”,但忽略了它“忙等”的本质,这搞不好会适得其反,反而拖慢整个系统的性能。所以,选择哪个,真的要看具体场景和性能分析。

C++ atomic_flagatomic:实现自旋锁的异同与考量

在C++中实现自旋锁,std::atomic_flagstd::atomic都是可行的选择,但它们之间确实存在一些细微但重要的差异。理解这些差异,能帮助我们做出更明智的选择。

OpenArt
OpenArt

在线AI绘画艺术图片生成器工具

下载

std::atomic_flag,就像我们前面示例中用的那样,是C++11标准库中最“原始”的原子类型。它的设计目标就是为了实现自旋锁这种简单的“锁住/解锁”机制。它的特点是:

  1. 保证lock-free:标准明确规定std::atomic_flag的操作是lock-free的,这意味着它不会依赖于操作系统级别的互斥量来实现原子性。
  2. API极简:只有test_and_set()clear()两个操作。test_and_set()原子地将flag设为true并返回旧值,clear()原子地将flag设为false。这种简洁性降低了出错的可能性。
  3. 默认内存序test_and_set()默认使用std::memory_order_acquireclear()默认使用std::memory_order_release。这正是实现自旋锁所需要的内存序,确保了在获取锁前后的内存同步。

std::atomic则是一个更通用的原子类型,它可以存储布尔值,并支持更多的原子操作,比如load()store()exchange()compare_exchange_weak()compare_exchange_strong()

  1. 不保证lock-free:虽然在大多数现代平台上,std::atomic通常也是lock-free的,但标准并没有强制要求。你可以通过is_lock_free()方法来检查。
  2. 更灵活的API:你可以用compare_exchange_weak()compare_exchange_strong()来实现自旋锁。例如:
    // 使用atomic实现自旋锁
    std::atomic lock_val = false;
    // lock()
    bool expected = false;
    while (!lock_val.compare_exchange_weak(expected, true, std::memory_order_acquire, std::memory_order_relaxed)) {
        expected = false; // compare_exchange_weak可能会失败,需要重置expected
        PAUSE_INSTRUCTION();
    }
    // unlock()
    lock_val.store(false, std::memory_order_release);

    这里,compare_exchange_weak会尝试将lock_valexpectedfalse)原子地改为true。如果成功,说明获取了锁;如果失败,说明锁已经被占用,lock_val的值会被更新为当前值(true),所以我们需要在循环内重置expected

  3. 内存序需要手动指定:虽然这提供了更大的灵活性,但也意味着你需要更清楚地知道每种操作应该使用哪种内存序,否则容易引入内存序错误。

在我看来,如果你仅仅需要一个最简单的自旋锁,std::atomic_flag是更直接、更安全的选择,因为它天生就是为此设计的,并且保证lock-free。它的API也更不容易出错。如果你需要更复杂的原子操作,或者对内存序有更精细的控制需求,那么std::atomic会提供更大的灵活性,但同时也要求你对原子操作和内存模型有更深入的理解。对于自旋锁这种特定用途,我通常会倾向于atomic_flag

优化自旋锁性能:std::this_thread::yield()_mm_pause指令

纯粹的自旋等待,也就是在一个while循环里什么都不做,只是不断检查锁状态,这其实是非常低效的。它不仅会白白消耗CPU周期,还会导致缓存一致性协议的流量激增,甚至可能因为CPU乱序执行的特性,导致性能进一步下降。所以,优化自旋等待是实现高性能自旋锁的关键。

这里主要有两种常见的优化策略:std::this_thread::yield()和处理器特定的_mm_pause指令。

  1. std::this_thread::yield(): 这个函数的作用是向操作系统调度器发一个“软提示”,告诉它:“嘿,我这个线程现在愿意放弃我当前的CPU时间片,如果你有其他就绪的线程,可以考虑让它们先运行。”它并不能保证线程一定会立即让出CPU,这取决于操作系统的调度策略和当前系统的负载情况。 在自旋锁的循环中加入std::this_thread::yield(),可以在一定程度上缓解CPU空转的问题。当锁被长时间占用,或者系统负载较高时,yield()有机会让当前线程暂时休息一下,让出CPU给持有锁的线程或其他有用线程。这对于降低CPU使用率和提高系统整体响应性是有帮助的。 然而,yield()的开销相对_mm_pause要大,因为它涉及与操作系统的交互。对于那些临界区极短,预期锁争用时间也极短的场景,yield()的开销可能反而会抵消自旋锁的优势。

  2. _mm_pause指令 (x86/x64): 这是针对x86和x64处理器架构的一个内在函数(intrinsic),它编译后会生成PAUSE汇编指令。这个指令是专门为自旋等待设计的,它做了几件重要的事情:

    • 降低功耗PAUSE指令会告诉CPU,当前核心正在自旋等待,可以进入低功耗状态,减少能耗。
    • 优化乱序执行:现代CPU为了提高性能会进行乱序执行。在自旋循环中,PAUSE指令可以作为内存屏障,防止CPU在循环内部进行过度的乱序猜测执行,从而避免不必要的缓存行失效和总线流量。它能有效地将CPU流水线“暂停”一小段时间,让CPU有机会重新加载缓存,避免重复的失败猜测。
    • 减少总线流量:通过优化乱序执行和降低功耗,PAUSE间接减少了处理器之间通过总线进行的缓存一致性协议(MESI等)通信,这在多核系统中尤为重要。

    在前面的SpinLock实现中,我们正是加入了PAUSE_INSTRUCTION()宏来利用这个指令。这在x86/x64平台上几乎是实现高效自旋锁的必备优化。如果没有它,即使是短临界区,自旋锁的性能也可能远低于预期,甚至不如互斥锁。

总结一下我的看法:在实现自旋锁时,_mm_pause(或其他架构的等效指令)是首选的优化手段,尤其是在你确定目标平台支持且临界区极短时。它的开销非常小,且直接作用于硬件层面。而std::this_thread::yield()则更像是一个“备用方案”或者“补充策略”,在无法使用PAUSE指令的平台,或者在自旋等待时间可能稍长的情况下,可以考虑加入它来降低CPU占用。一个健壮的自旋锁实现,往往会优先考虑平台特定的PAUSE指令,并在必要时结合yield()或者更复杂的退让策略(比如指数退避)。

相关专题

更多
while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

89

2023.09.25

while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

89

2023.09.25

while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

89

2023.09.25

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

481

2023.08.10

Python 多线程与异步编程实战
Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧,包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例,帮助学习者掌握 如何构建高性能、多任务并发的 Python 应用。

143

2025.12.24

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

44

2026.01.16

全民K歌得高分教程大全
全民K歌得高分教程大全

本专题整合了全民K歌得高分技巧汇总,阅读专题下面的文章了解更多详细内容。

89

2026.01.16

C++ 单元测试与代码质量保障
C++ 单元测试与代码质量保障

本专题系统讲解 C++ 在单元测试与代码质量保障方面的实战方法,包括测试驱动开发理念、Google Test/Google Mock 的使用、测试用例设计、边界条件验证、持续集成中的自动化测试流程,以及常见代码质量问题的发现与修复。通过工程化示例,帮助开发者建立 可测试、可维护、高质量的 C++ 项目体系。

25

2026.01.16

java数据库连接教程大全
java数据库连接教程大全

本专题整合了java数据库连接相关教程,阅读专题下面的文章了解更多详细内容。

36

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 6.9万人学习

C 教程
C 教程

共75课时 | 4.1万人学习

C++教程
C++教程

共115课时 | 12.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号