C++ 超立方体排序

2025年3月22日 | 阅读4分钟

超立方体排序 是一种并行排序算法，可以有效地对大量数据进行排序，它在多个处理器上运行。其基础是超立方体架构，其中每个处理器和节点都被视为 n 维超立方体中的一个顶点。其主要概念是利用超立方体的结构进行交换和比较，以最小化整体通信成本并均匀分配排序工作负载。该方法通过一个基于每个节点（处理器）索引的二进制编码的循环过程，在超立方体中对数据进行排序。节点在每个阶段与它们的邻居通信，以并发地交换元素和排序数据。

超立方体排序的关键概念

C++ 中超立方体排序的几个概念如下

超立方体拓扑： 一个 n 维超立方体包含 2^n 个节点。如果任意两个节点的地址（每个地址都是一个 n 位二进制数）之间只相差一位，那么这些节点是相互连接的。
并行处理： 在处理器之间的交互中，超立方体形状极大地提供了帮助，因为它们现在必须共享在其间分配的数据集。每个处理器的邻居负责对其拥有的数据部分进行排序，并与它们的直接邻居通信以创建一个全局排序的数组。
递归排序： 该方法通过将初始问题分解为各种小问题并并行处理它们来减少问题，这符合处理器的工作方式。

超立方体排序遵循的基本步骤

数据分布： 数据首先被分区并分布在超立方体的节点上。
按维度排序： 在此算法的每个阶段，超立方体都根据一个特定的维度进行排序。例如，考虑其中一个维度，沿该维度的每个节点将与其邻居比较和交换数据，以便数据更接近其应放置的位置。
递归减半： 通过在每个步骤中递归地将需要排序的数据量减半来利用超立方体的形式。
最终合并： 当所有维度都递归排序完成后，排序后的数据将跨所有节点集成。

使用 C++ 实现的注意事项

并行库： 在 C++ 中实现超立方体排序时，可以使用像 MPI（消息传递接口）这样的并行库来管理处理器之间的连接。
分布式数据结构： 由于数据被分区到多个 CPU 中，本地数据的排序和收集需要一定的工作量。
效率： 对于大规模并行处理系统，超立方体排序将非常有效，因为它通过最小化处理器通信来保持平衡的工作负载。

示例

步骤 1

安装 MPI 库

UBUNTU 命令

 
sudo apt-get update
sudo apt-get install openmpi-bin openmpi-common libopenmpi-dev   

步骤 2：使用 MPI 编译器编译

步骤 3：运行 MPI 编译器的命令

编码

 
#include <mpi.h>
#include <iostream>
#include <vector>
#include <algorithm>
#include <cmath>  // for log2

// Function to perform Hypercube Sort on the local data
void hypercubeSort(std::vector<int>& localData, int processRank, int totalProcesses) {
    int dimensions = log2(totalProcesses);  // Determine the dimension of the hypercube

    for (int d = 0; d < dimensions; ++d) {
        // Sort local data
        std::sort(localData.begin(), localData.end());

        // Determine partner process based on current dimension
        int partnerRank = processRank ^ (1 << d);  // Calculate partner process rank
        std::vector<int> partnerData(localData.size());

        // Send and receive data with the partner process
        MPI_Sendrecv(localData.data(), localData.size(), MPI_INT, partnerRank, 0, 
                     partnerData.data(), partnerData.size(), MPI_INT, partnerRank, 0, 
                     MPI_COMM_WORLD, MPI_STATUS_IGNORE);

        // Merge local data with received partner data
        std::vector<int> mergedData(localData.size() + partnerData.size());
        std::merge(localData.begin(), localData.end(), partnerData.begin(), partnerData.end(), mergedData.begin());

        // Select the correct half of the merged data based on process rank
        if (processRank < partnerRank) {
            localData.assign(mergedData.begin(), mergedData.begin() + localData.size());
        } else {
            localData.assign(mergedData.begin() + localData.size(), mergedData.end());
        }
    }
}

int main(int argc, char** argv) {
    MPI_Init(&argc, &argv);  // Initialize the MPI environment

    int processRank, totalProcesses;
    MPI_Comm_rank(MPI_COMM_WORLD, &processRank);  // Get the rank of the current process
    MPI_Comm_size(MPI_COMM_WORLD, &totalProcesses);  // Get the total number of processes

    // Initialize local data on each process with a different set of values
    std::vector<int> localData = {processRank * 3 + 5, processRank * 3 + 6, processRank * 3 + 7};  // Sample data for each process

    // Perform Hypercube Sort
    hypercubeSort(localData, processRank, totalProcesses);

    // Display sorted data in each process
    std::cout << "Process Rank " << processRank << ": ";
    for (int num : localData) {
        std::cout << num << " ";
    }
    std::cout << std::endl;

    MPI_Finalize();  // Finalize the MPI environment
    return 0;
}   

输出

 
Rank 0: 1 2 
Rank 1: 3 4 
Rank 2: 5 6 
Rank 3: 7 8

结论

在 超立方体排序中， 排序工作以低通信成本和最高的排序效率分配给多个处理器。超立方体排序根据其二进制地址将数据分解并将其部分分散到附近的节点。因此，超立方体可以将大型数据集并行排序为一种高效的并行排序技术，从而大大减少分布式系统中执行排序所需的时间。超立方体排序的 C++ 版本使用 MPI 来展示任务如何协同工作以实现全局排序，尽管存在局部排序和进程间通信。这使得该算法在高性能计算方面具有高度竞争力，这对于大规模并行性作为分布式内存系统中有效的排序方法是必需的。

下一主题C++ 计算中心九边形数程序

C++ 超立方体排序

超立方体排序的关键概念

超立方体排序遵循的基本步骤

使用 C++ 实现的注意事项

示例

步骤 1

安装 MPI 库

步骤 2：使用 MPI 编译器编译

步骤 3：运行 MPI 编译器的命令

结论

联系信息

关注我们

教程

面试题

在线编译器

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

C++ 教程

C++ 控制语句

C++ 函数

C++ 数组

C++ 类和对象

C++ 构造函数

C++ 继承

C++ 多态

C++ 抽象

C++ 命名空间

C++ 模板

C++ 字符串

C++ 指针

信号处理

C++ 异常

C++ 文件与流

C++ STL 教程

面试题

选择题

C++ 程序

C++ STL Stack

C++ STL Bitset

C++ STL Deque

C++ STL List

C++ STL Map

C++ STL Math

C++ STL priority_queue

C++ STL Queue

C++ STL Multiset

C++ STL Multimap

C++ STL Set

C++ STD Strings

C++ STL Vector

C++ 操纵符

C++ STL Algorithms

C++ Algorithm

C++ Iterators

C++ 杂项

C++ 超立方体排序

超立方体排序的关键概念

超立方体排序遵循的基本步骤

使用 C++ 实现的注意事项

示例

步骤 1

安装 MPI 库

步骤 2：使用 MPI 编译器编译

步骤 3：运行 MPI 编译器的命令

结论

相关帖子

C++ 凸包算法

C++ 中检查一个数是否为毕达哥拉斯素数

C++ 中的 std::basic_filebuf::seekoff

C++ 中的 STL 绳索

C++ 中打印 V 形和倒 V 形图案的程序

C++ 中的最小包围圆 (MEC)

C++ 中的 std::span::subspan 函数

C++ std::ranges::lazy_split 函数

C++ 翻转矩阵前传

C++ 中的工作窃取算法

订阅 Tpoint Tech