现代 C++ 中 STL 算法的执行策略

17 Mar 2025 | 5 分钟阅读

现代 C++ 中的标准模板库 (STL) 提供了广泛的算法，可在基本序列（包括向量、数组和列表）上运行。这些算法适用于不同的迭代器，并作为模板函数实现。这些算法以泛型编程的基本原理为基础构建，并广泛使用迭代器来抽象底层数据结构。

在 STL 算法的上下文中，执行策略描述了算法如何并行运行。这是在 C++17 中添加的，旨在使程序员能够在处理大数据集时在特定算法中使用并行性。以下是三种执行策略：

1. 顺序执行

此策略，即 std::execution::seq（顺序执行），确保了这一点。如果没有提供执行策略，则使用默认执行策略。它确保算法将在单个线程中运行，并且执行顺序将与输入迭代器的序列匹配。

语法

它具有以下语法：

示例

让我们举一个例子来说明 C++ 中的 **顺序执行**。

#include <algorithm>
#include <iostream>
#include <vector>
#include <execution>
int main()
{
std::vector<int> v = { 7, 9, 8, 1, 1 };
std::sort(std::execution::seq, v.begin(), v.end());
for (auto i : v)
std::cout << i << " ";
return 0;
}

输出

Execution Policy of STL Algorithms in Modern C++

2. 标准::执行::并行 (并行执行)

此策略允许并行算法执行。是否使用线程、矢量化或任何其他并行化技术由实现决定；C++ 标准库不强制规定如何实现并行性。

语法

它具有以下语法：

示例

让我们举一个例子来说明 C++ 中的 **并行执行**。

#include <algorithm>
#include <execution>
#include <iostream>
#include <vector>
int main()
{
std::vector<int> v1 = { 1, 2, 3, 4, 5 };
std::vector<int> v2(5);
std::transform(std::execution::par, v1.begin(),
				v1.end(), v2.begin(),
[](int x) { return x * x; });
for (int i : v2) {
std::cout << i << " ";
}
return 0;
}

输出

**3. 并行非序列执行**，或 **std::execution::par_unseq**，是一种与 **std::execution::par** 类似的策略，但允许算法的矢量化。这意味着除了能够并行运行之外，算法还可以被矢量化，以提高单个迭代的性能。

语法

它具有以下语法：

示例

让我们举一个例子来说明 C++ 中的 **并行非序列执行**。

#include <algorithm>
#include <iostream>
#include <vector>
#include <execution>
int main()
{
std::vector<int> v = { 1, 2, 3, 4, 5 };
std::for_each(std::execution::par_unseq, v.begin(),v.end(),
				[](int x) { std::cout << x << " "; });
return 0;
}

输出

重要的是要记住，并非所有算法都可以从并行执行中受益，并且性能增益的大小将取决于算法的性质、数据的大小和硬件架构。在选择并行执行策略之前，应进行性能分析和测量，因为同步和其他因素可能导致并行执行引入开销。

示例

以下是一个简单的示例，演示了将 **std::execution::par** 与 **std::for_each** 结合使用：

#include <algorithm>
#include <execution>
#include <iostream>
#include <vector>
int main() {
std::vector<int> numbers = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};
std::for_each(std::execution::par, numbers.begin(), numbers.end(), [](int& num) {
num *= 2;
});

for (const auto& num : numbers) {
std::cout << num << " ";
}
return 0;
}

输出

说明

在此示例中，**lambda 函数** 并行应用于每个向量元素，使每个元素加倍。

执行策略之间的性能比较

可以使用一个简单的 C++ 程序来比较执行策略之间的性能差异，如下所示：

// C++ Program to evaluate the performance of the four
// execution policies
#include <chrono>
#include <execution>
#include <iostream>
#include <vector>
// Function to calculate the execution time of different
// execution policies
void execTime(auto policy_type, std::vector<int>& num,
			std::string pType_name)
{
auto start_time= std::chrono::high_resolution_clock::now();

long long sum = 0;

// finding sum of each element in the vector
std::for_each(policy_type, num.begin(), num.end(),
				[&](int n) { sum += n; });

auto end_time= std::chrono::high_resolution_clock::now();
auto taken_time = std::chrono::duration_cast<std::chrono::milliseconds>(end_time - start_time).count();
// printing execution time
std::cout << pType_name
<< " execution time: " << taken_time<< "ms\n";
}
int main()
{
// Creating large vector of int
int size = 9999999;
std::vector<int> num(size);
// initializing vector
for (int i = 0; i < size; i++) {
num[i] = i;
}
// execution time
execTime(std::execution::seq, num, "Sequenced");
execTime(std::execution::unseq, num, "Unsequenced");
execTime(std::execution::par, num, "Parallel");
execTime(std::execution::par_unseq, num,"Parallel Unsequenced");
return 0;
}

输出

说明

如您所见，最快的执行策略是 unsequenced_policy，因为它进行了矢量化。接下来是 parallel_policy，然后是 parallel_unsequenced_policy。最终，您按照计划的顺序执行了执行技术。

重要的是要记住，并非每个算法都支持每个执行策略，并且根据选择的执行策略，某些算法的性能可能会有所不同。选择最适合任务要求和手头硬件的执行策略至关重要。您还应该测试各种策略，以找到特定任务的最佳策略。

现代 C++ 中 STL 算法执行策略的优点

由于 C++17 中在 STL 算法中添加了执行策略，开发人员现在可以管理特定算法的并行执行。此功能有几个优点：

**并行性带来的性能提升：** 主要优点是使用并行性来提高多核处理器的性能。通过并行化一些算法以并发处理数据，可以更快地处理大型数据集。
**增强的响应能力：** 处理大型数据集的应用程序可以从并行执行中受益，这可以增强响应能力。通过在多个线程或核心之间分配工作负载，算法可以更快地执行和响应。
**可伸缩性：** 通过利用可用的硬件资源，执行策略使应用程序更具可伸缩性。随着处理器核心数量的增加，实现最佳性能越来越依赖于并行执行。
**灵活性和可移植性：** 开发人员可以根据其应用程序的参数和算法的属性选择最佳执行策略。由于其适应性，可以进行优化以满足各种场景的独特要求。
**细粒度控制：** 可以使用执行策略精细控制并行度。根据算法及其要求，开发人员可以在顺序执行 **(std::execution::seq)**、并行执行 **(std::execution::par)** 和并行非序列执行 **(std::execution::par_unseq)** 之间进行选择。
**与现有代码的兼容性：** 默认情况下，对于使用 STL 算法但未定义执行策略的现有代码，顺序执行功能完美无缺。因此，保证了向后兼容性，开发人员可以根据需要逐步实现并行性。
**性能分析：** 在执行策略之间切换的能力使性能分析和调优更容易。当开发人员可以测试各种策略并衡量它们对性能的影响时，定位瓶颈和优化关键代码段变得更简单。
**简洁易读的代码：** 尽管并行执行的底层复杂性，但在 STL 算法中使用执行策略使开发人员能够简洁易读地表达并行性。算法调用仍然已知，并且行为由充当修改器的执行策略控制。

重要的是要记住，并非所有算法都同样受益于并行化，并且并行执行的效率因算法性质、大小和硬件架构等多个变量而异。建议使用性能分析和仔细考虑来确定在特定情况下执行策略的最佳使用。

下一主题C++ 中的 Feclearexcept

现代 C++ 中 STL 算法的执行策略

1. 顺序执行

语法

示例

2. 标准::执行::并行 (并行执行)

语法

示例

示例

执行策略之间的性能比较

现代 C++ 中 STL 算法执行策略的优点

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

C++ 教程

C++ 控制语句

C++ 函数

C++ 数组

C++ 类和对象

C++ 构造函数

C++ 继承

C++ 多态

C++ 抽象

C++ 命名空间

C++ 模板

C++ 字符串

C++ 指针

信号处理

C++ 异常

C++ 文件与流

C++ STL 教程

面试题

选择题

C++ 程序

C++ STL Stack

C++ STL Bitset

C++ STL Deque

C++ STL List

C++ STL Map

C++ STL Math

C++ STL priority_queue

C++ STL Queue

C++ STL Multiset

C++ STL Multimap

C++ STL Set

C++ STD Strings

C++ STL Vector

C++ 操纵符

C++ STL Algorithms

C++ Algorithm

C++ Iterators

C++ 杂项

现代 C++ 中 STL 算法的执行策略

1. 顺序执行

语法

示例

2. 标准::执行::并行 (并行执行)

语法

示例

示例

执行策略之间的性能比较

现代 C++ 中 STL 算法执行策略的优点

相关帖子

C 和 C++ 中的 'void*' 有何不同

C++ 中的 match_results prefix() 和 suffix()

C++ 设计模式

C++ 中隐藏基类中所有同名重载方法

C++ 与 Go 语言的区别

C++ forward_list merge()

C++ 合并排序伪代码

在 C/C++ 中打印字符串的所有子字符串，其中元音和辅音数量相等

C++ Boost 库

C++ 程序实现费马小定理

订阅 Tpoint Tech