c++++17通过execution policy实现并行算法,提升多核cpu性能。一、execution policy有三种:std::execution::seq顺序执行;std::execution::par允许并行,适用于无副作用函数;std::execution::par_unseq允许并行和向量化,要求操作无状态且安全。二、选择策略依据任务特性:1.seq用于数据量小或调试阶段;2.par用于大数据量和纯函数操作;3.par_unseq用于高度可向量化计算。三、使用注意事项包括:1.部分算法无法加速;2.lambda表达式避免副作用;3.优先使用vector等连续内存容器;4.需实际测试性能差异。四、适用场景如大规模排序、数据变换归约等,但应实测验证效果。

C++17 引入了并行算法的支持,使得标准库中的许多常用算法可以在多核 CPU 上并行执行。核心机制就是通过传递一个execution policy(执行策略)参数来控制算法的执行方式。用得好,可以显著提升性能;用得不对,可能反而拖慢程序甚至引发数据竞争。

一、execution policy 是什么?
在 C++17 的 头文件中定义了三种执行策略:

-
std::execution::seq:顺序执行,不启用并行。 -
std::execution::par:允许并行执行,适用于无副作用的函数对象。 -
std::execution::par_unseq:允许并行和向量化执行,要求操作必须是“无状态”且安全的。
这些策略作为第一个参数传给支持它们的标准算法,比如 std::transform、std::reduce、std::sort 等。例如:
立即学习“C++免费学习笔记(深入)”;
std::vectordata = /* ... */; std::sort(std::execution::par, data.begin(), data.end());
注意,并不是所有算法都支持并行版本,也不是所有平台都能真正并行执行。实际效果取决于编译器实现和运行环境。

二、如何选择合适的执行策略?
使用哪个策略,关键看你的任务是否适合并行,以及你能否确保线程安全。
1. 使用 seq 的情况:
- 数据量小,拆分成本高于收益。
- 操作本身有副作用或依赖顺序。
- 调试阶段,避免并发带来的复杂性。
2. 使用 par 的情况:
- 数据量大,适合分割处理。
- 操作是纯函数,或者只读共享数据。
- 需要充分利用多核 CPU 提升性能。
3. 使用 par_unseq 的情况:
- 操作高度可向量化(如数值计算)。
- 编译器支持自动向量化优化。
- 注意:该策略对 lambda 表达式的要求更严格,不能有任何副作用。
三、并行算法使用的几个注意事项
1. 并非所有算法都能加速
有些算法即使加上 par 也不会变快,比如 std::find,因为它一旦找到就提前结束,而并行执行需要等待所有线程结果。
2. Lambda 表达式要小心副作用
如果你的 lambda 捕获了外部变量并修改它,可能会导致数据竞争。例如:
int sum = 0;
std::for_each(std::execution::par, v.begin(), v.end(), [&](int x) {
sum += x; // ❌ 不安全!多个线程同时修改 sum
});应该使用原子变量,或者改用 std::transform_reduce 这类能合并中间结果的算法。
3. 容器迭代器类型要支持并行
某些容器(比如 std::list)的迭代器效率低,不适合并行处理。推荐使用连续内存结构,如 std::vector 或 std::array。
4. 性能测试必不可少
并行并不总是更快。你可以这样对比:
// 测试串行 auto t1 = now(); std::sort(data.begin(), data.end()); auto t2 = now(); // 测试并行 std::sort(std::execution::par, data.begin(), data.end()); auto t3 = now(); std::cout << "Serial: " << t2 - t1 << "\n"; std::cout << "Parallel: " << t3 - t2 << "\n";
根据实际运行时间决定是否值得启用并行。
四、常见适用场景举例
场景一:大规模数据排序
当你要排序上万个元素时,使用 std::sort(std::execution::par, ...) 往往比串行快不少。
场景二:数据变换与归约
比如图像处理中对每个像素做某种变换后求总和,可以用 std::transform_reduce:
int total = std::transform_reduce(
std::execution::par,
pixels.begin(), pixels.end(),
0,
std::plus<>{},
[](Pixel p) { return compute_intensity(p); }
);场景三:过滤 + 统计
虽然 std::count_if 支持并行,但要注意谓词函数不能有副作用。
基本上就这些。合理利用 execution policy 可以让 C++17 的标准算法在现代硬件上跑得更快,但也别盲目加 par,性能调优还是得靠实测。










