C++17中std::execution提供seq、par、par_unseq三种执行策略,用于控制STL算法的执行方式。通过在算法调用时传入对应策略,如std::sort(std::execution::par, begin, end),可实现顺序、并行或向量化执行。par适用于多线程并行,par_unseq进一步支持SIMD优化,能显著提升大规模数据处理性能。使用时需确保操作线程安全、避免小数据集开销,并确认编译器与库支持,如GCC 9+配合libtbb。常见支持算法包括sort、transform、find等,合理使用可有效利用多核资源提升效率。

在C++17中,std::execution 提供了并行执行策略,让STL算法可以利用多核CPU加速数据处理。通过选择合适的执行策略,你可以显著提升对大规模容器操作的性能,比如排序、查找、变换等。
std::execution 支持的三种执行策略
标准库定义了三个预定义的执行策略对象,用于控制算法如何执行:
- std::execution::seq:顺序执行,不允许并行。同一线程内逐个处理元素。
- std::execution::par:允许并行执行。算法可以在多个线程中运行,适用于可并行化的操作。
- std::execution::par_unseq:允许并行和向量化执行。不仅支持多线程,还允许使用SIMD指令(如SSE/AVX)优化循环。
如何在STL算法中使用执行策略
大多数支持并行的STL算法都重载了版本,接受执行策略作为第一个参数。例如 std::sort、std::for_each、std::transform 等。
示例:并行排序一个大数组
立即学习“C++免费学习笔记(深入)”;
#include#include #include #include std::vector
data(1000000); // 填充数据 for (int i = 0; i < data.size(); ++i) { data[i] = rand(); } // 使用并行策略排序 std::sort(std::execution::par, data.begin(), data.end());
这比默认的单线程排序快很多,尤其在多核机器上。
示例:并行转换数据(如批量平方)
std::vectorinput(1000000, 2); std::vector output(input.size()); std::transform(std::execution::par_unseq, input.begin(), input.end(), output.begin(), [](int x) { return x * x; });
这里使用 par_unseq 允许编译器自动向量化循环,进一步提升性能。
使用并行策略的注意事项
虽然并行能提速,但不是所有情况都适用。需要注意以下几点:
- 函数对象必须是线程安全的。避免共享可变状态或使用互斥量保护。
- 小数据集可能反而变慢,因为并行调度有开销。一般建议数据量超过几千元素再考虑并行。
- 某些算法如 std::find 在并行模式下可能提前返回,但不保证顺序。
- 并非所有标准库实现都完全支持并行策略。GCC从9开始较好支持,Clang部分支持,MSVC逐步完善。
启用并行策略通常需要链接特定库(如libtbb),编译时加上 -ltbb 可能是必要的。
常见可用并行算法列表
以下STL算法支持执行策略(C++17起):
- std::for_each, std::for_each_n
- std::find, std::find_if, std::find_if_not
- std::count, std::count_if
- std::sort, std::stable_sort, std::partial_sort
- std::copy, std::move, std::fill, std::replace
- std::transform, std::generate
- std::reduce, std::transform_reduce
- std::all_of, std::any_of, std::none_of
基本上就这些。只要数据足够大,逻辑无副作用,并行策略就能帮你轻松榨干CPU性能。









