C++ kruskal's 算法

2024年8月28日 | 阅读 12 分钟

树在计算机科学和数据结构领域至关重要，可用于有效组织和管理数据。在现实世界的应用中，树是用于描绘各种连接和层级关系的层级结构。它们是计算机科学的基石，因为它们对算法和数据处理至关重要。在本文中，我们将探讨树的基本概念、不同类型以及在数据结构中的实际应用。

历史

Kruskal 算法是图论和计算机科学中用于查找连通的无向图的最小生成树的基本算法。最小生成树是图的边的一个子集，它形成一棵树，以最小的总边权重连接所有顶点。该算法由 Joseph Kruskal 于 1956 年在哈佛大学学习期间开发。

该算法的历史可以追溯到 20 世纪中叶，当时计算机科学领域尚处于起步阶段。Joseph Kruskal 与他的导师 Samuel Winograd 一起，对网络设计的优化感兴趣，这促使了该算法的开发。Kruskal 的工作受到了最小生成树领域早期研究的影响，特别是捷克数学家 Otakar Borůvka 的工作。

Kruskal 算法是查找最小生成树的一种贪婪方法。它从一个空边集开始，然后迭代地向该集合添加边，同时确保不形成环。边按权重升序添加，并且只包含那些不会在增长的森林中产生环的边。当所有顶点都连接起来形成最小生成树时，这个过程就会继续。

该算法的简洁性和效率使其成为网络设计和优化领域的基石。它的时间复杂度为 O(E log E)，其中 E 是图中的边数，这使其对于各种实际应用来说都非常高效。Kruskal 算法广泛应用于计算机网络、交通规划以及其他需要高效构建最小生成树的领域。

Kruskal 算法是计算机科学和图论历史上的一个重要发展，其根源可以追溯到 20 世纪中叶。它在查找最小生成树方面优雅而高效的方法使其成为解决各种现实世界问题的基本工具，其遗产继续影响着各个领域的算法设计和优化。

理解基础知识

在深入探讨树的细节之前，让我们先建立一些基本概念。

节点：节点是树的基本组成部分。每个节点都有数据和 0 个子节点。顶部的节点称为“根”，而没有子节点的节点称为“叶子”。
边：在树中，边将节点连接在一起。它们显示了哪些节点是父节点和子节点，以及节点之间的关系。
层级：树是层级结构，这意味着它们遵循预定的层级。节点按照层级排列，根节点位于顶部，下方有多个子节点层。

树的类型

存在不同类型的树，每种树都经过设计，用于实现特定功能或解决特定问题。常见的树类型包括：

二叉树：也称为左子节点和右子节点，二叉树允许每个节点最多有两个子节点。二叉搜索树和表达式树只是二叉树众多用途中的两个示例。
二叉搜索树 (BST)：二叉搜索树是一种二叉树，其节点排列方式可以快速执行搜索、插入和删除操作。父节点的左侧和右侧节点的数值分别小于和大于父节点。
AVL 树：AVL 树是一种自平衡二叉搜索树。它通过确保每个节点的左子树和右子树的高度相差不超过一，来保持结构平衡。这种平衡使得搜索活动高效。
红黑树：另一种自平衡二叉搜索树是红黑树。它使用一套规则来维护平衡结构，使其适用于各种应用。
B 树：B 树是一种多路树，常用于文件系统和数据库。通过维护具有可变数量子节点的平衡结构，它们提供了高效的数据存储和检索。
Trie：Trie（发音为“try”）是一种类似于树的数据结构，用于存储和搜索动态字符串集合，例如字典中的单词或路由器中的 IP 地址。

实际应用

既然我们已经考察了树的基本原理和变体，现在让我们来看一些树的实际应用。

文件系统：为了组织文件和目录，文件系统（如您计算机上的文件系统）经常采用树拓扑结构。每个目录都可以包含文件和子目录，从而形成层级结构。
数据库系统：为了有效存储和检索数据，许多数据库系统使用 B 树和其他树结构。即使对于大型数据集，这些结构也提供了对数据的快速访问。
网络路由：为了选择最佳路径供数据包从源传输到目标，计算机网络中的路由器使用基于树的算法。
编译器使用抽象语法树 (AST) 来表示程序代码的结构。AST 对于代码生成和解析至关重要。
组织层级：在公司中，组织层级可以表示为树，每个节点表示一个部门或员工及其相应的层级关系。
游戏制作：树用于组织视频游戏制作中的游戏元素、它们的交互以及它们的行为。行为树是这种用法的典型示例。

理解贪婪算法：优化选择步步为营

在计算机科学和优化领域，一个强大而直观的技术经常浮出水面，那就是贪婪算法。贪婪算法是多功能的解题策略，它们在每一步都做出决策，旨在最大化或最小化特定的目标函数。这些算法概念简单，但在各种应用中可能非常有效。在本文中，我们将深入探讨贪婪算法的世界，探索其核心原理、优点和局限性。

什么是贪婪算法？

本质上，贪婪算法通过一系列局部最优选择来达到全局最优解。它通过在每一步选择最佳选项来运行，而不考虑整体后果。这种短视的方法可以比作一个人在每个决策点上始终选择即时最佳选项，希望达到最佳的整体结果。

贪婪算法的关键特征

1. 贪婪选择性质

贪婪算法的基本特征是其“贪婪选择性质”。在每一步，算法都会选择在该特定时刻看起来是最佳选择的选项，而不管大局。选择是基于特定标准做出的，该标准可能涉及最大化或最小化某个值。

2. 最优子结构

贪婪算法依赖于“最优子结构”的概念，这意味着最优地解决一个较小的子问题有助于最优地解决较大的问题。换句话说，问题可以分解为较小的、可管理的子问题，这些子问题本身可以使用相同的贪婪方法来解决。

下面是 Kruskal 算法在 C++ 中的实现：

// C++ program for Kruskal's algorithm to find Minimum 
// Spanning Tree of a given connected, undirected and 
// weighted graph 
#include<bits/stdc++.h> 
using namespace std; 

// Creating shortcut for an integer pair 
typedef pair<int, int> iPair; 

// Structure to represent a graph 
struct Graph 
{ 
	int V, E; 
	vector< pair<int, iPair> > edges; 

	// Constructor 
	Graph(int V, int E) 
	{ 
		this->V = V; 
		this->E = E; 
	} 

	// Utility function to add an edge 
	void addEdge(int u, int v, int w) 
	{ 
		edges.push_back({w, {u, v}}); 
	} 

	// Function to find MST using Kruskal's 
	// MST algorithm 
	int kruskalMST(); 
}; 

// To represent Disjoint Sets 
struct DisjointSets 
{ 
	int *parent, *rnk; 
	int n; 

	// Constructor. 
	DisjointSets(int n) 
	{ 
		// Allocate memory 
		this->n = n; 
		parent = new int[n+1]; 
		rnk = new int[n+1]; 

		// Initially, all vertices are in 
		// different sets and have rank 0. 
		for (int i = 0; i <= n; i++) 
		{ 
			rnk[i] = 0; 

			//every element is parent of itself 
			parent[i] = i; 
		} 
	} 

	// Find the parent of a node 'u' 
	// Path Compression 
	int find(int u) 
	{ 
		/* Make the parent of the nodes in the path 
		from u--> parent[u] point to parent[u] */
		if (u != parent[u]) 
			parent[u] = find(parent[u]); 
		return parent[u]; 
	} 

	// Union by rank 
	void merge(int x, int y) 
	{ 
		x = find(x), y = find(y); 

		/* Make tree with smaller height 
		a subtree of the other tree */
		if (rnk[x] > rnk[y]) 
			parent[y] = x; 
		else // If rnk[x] <= rnk[y] 
			parent[x] = y; 

		if (rnk[x] == rnk[y]) 
			rnk[y]++; 
	} 
}; 

/* Functions returns weight of the MST*/

int Graph::kruskalMST() 
{ 
	int mst_wt = 0; // Initialize result 

	// Sort edges in increasing order on basis of cost 
	sort(edges.begin(), edges.end()); 

	// Create disjoint sets 
	DisjointSets ds(V); 

	// Iterate through all sorted edges 
	vector< pair<int, iPair> >::iterator it; 
	for (it=edges.begin(); it!=edges.end(); it++) 
	{ 
		int u = it->second.first; 
		int v = it->second.second; 

		int set_u = ds.find(u); 
		int set_v = ds.find(v); 

		// Check if the selected edge is creating 
		// a cycle or not (Cycle is created if u 
		// and v belong to same set) 
		if (set_u != set_v) 
		{ 
			// Current edge will be in the MST 
			// so print it 
			cout << u << " - " << v << endl; 

			// Update MST weight 
			mst_wt += it->first; 

			// Merge two sets 
			ds.merge(set_u, set_v); 
		} 
	} 

	return mst_wt; 
} 

// Driver program to test above functions 
int main() 
{ 
	/* Let us create above shown weighted 
	and undirected graph */
	int V = 9, E = 14; 
	Graph g(V, E); 

	// making above shown graph 
	g.addEdge(0, 1, 4); 
	g.addEdge(0, 7, 8); 
	g.addEdge(1, 2, 8); 
	g.addEdge(1, 7, 11); 
	g.addEdge(2, 3, 7); 
	g.addEdge(2, 8, 2); 
	g.addEdge(2, 5, 4); 
	g.addEdge(3, 4, 9); 
	g.addEdge(3, 5, 14); 
	g.addEdge(4, 5, 10); 
	g.addEdge(5, 6, 2); 
	g.addEdge(6, 7, 1); 
	g.addEdge(6, 8, 6); 
	g.addEdge(7, 8, 7); 

	cout << "Edges of MST are \n"; 
	int mst_wt = g.kruskalMST(); 

	cout << "\nWeight of MST is " << mst_wt; 

	return 0; 
}

输出

Edges of MST are 
6 - 7
2 - 8
5 - 6
0 - 1
2 - 5
2 - 3
0 - 7
3 - 4
Weight of MST is 37
...................................
Process executed in 0.11 seconds
Press any key to continue.

解释

#include<bits/stdc++.h> using namespace std;
这些行包含此程序所需的 C++ 标准库。
typedef pair<int, int> iPair;
此行定义了一个简写 iPair，用于整数对。
struct Graph
这是表示图的结构的定义。
它有三个成员变量：V（顶点数）、E（边数）和 edges（一对元素的向量，其中每对表示边的权重及其顶点）。
Graph(int V, int E)
这是 Graph 结构的构造函数，用于初始化顶点数和边数。
void addEdge(int u, int v, int w)
这是 Graph 结构的成员函数，用于向图中添加边。它接受源顶点 u、目标顶点 v 和边的权重 w。
int kruskalMST()
这是 Graph 结构的成员函数，它实现了 Kruskal 算法来查找最小生成树。它返回 MST 的权重。
struct DisjointSets
此结构表示用于 Kruskal 算法的并查集。它具有父节点、秩和集合中元素数量的成员变量。
DisjointSets(int n)
DisjointSets 结构的构造函数，用于初始化并查集和秩。
int find(int u)
使用路径压缩查找节点 'u' 的父节点的函数。
void merge(int x, int y)
用于按秩合并的函数，合并两个集合。
int Graph::kruskalMST() （方法实现）
此函数实现 Kruskal 算法来查找图的最小生成树。
main() 函数
演示在特定图上 Kruskal 算法的驱动程序。
它创建了一个 Graph 实例，向其中添加边，然后调用 kruskalMST 函数来查找 MST。
最后，它打印 MST 的边及其总权重。
该代码使用 C++ 标准库数据结构和函数来实现 Kruskal 算法，以查找图的 MST。

时间和空间复杂度分析

Kruskal 算法是一种贪婪算法，它通过迭代选择权重最小的边并避免环来查找 MST。为了分析此代码的时间和空间复杂度，我们将逐步进行分解。

时间复杂度

初始化图并添加边需要 O(E) 时间，其中 E 是边数。
使用 sort 函数对边进行排序需要 O(E * log(E)) 时间。排序是代码中最耗时的操作。
创建并查集结构需要 O(V) 时间，其中 V 是顶点数。
主循环遍历所有排序后的边，并执行依赖于边数 E 的操作。

在循环中：

使用路径压缩查找节点（并查集）几乎需要恒定的摊销时间 O(log*(V))，其中 log* 是迭代对数。实际上，它几乎是恒定的，非常接近 O(1)。
按秩合并两个集合也需要几乎恒定的时间 O(1)。
因此，代码的整体时间复杂度主要由排序步骤决定，即 O(E * log(E))。实际上，对于密集图，这非常接近 O(E * log(V))，这是 Kruskal 算法时间复杂度更常见的表达式。

空间复杂度

空间复杂度主要由代码中使用的数据结构决定。
edges 向量存储所有带有权重的边，这需要 O(E) 空间。
并查集结构需要额外的父节点和秩数组空间，这需要 O(V) 空间。
用于变量、迭代器和其他常量的额外空间相对较小，可以视为常量。
因此，代码的空间复杂度为 O(E + V)，其中 E 是边数，V 是顶点数。在大多数情况下，E 远小于 V，因此空间复杂度可以近似为 O(V)。
总之，此代码的时间复杂度主要由排序步骤 O(E * log(E)) 决定，空间复杂度为 O(E + V)。Kruskal 算法在稀疏图上寻找 MST 时效率很高，并且在实践中表现良好。

贪婪算法的应用

贪婪算法在经济学、工程学和计算机科学等各个领域都有应用。它们用于以下情况：

1. 最短路径问题

Dijkstra 算法等贪婪技术在图论和网络路由中能有效地识别两个节点之间的最短路径。程序在到达目标之前，会反复选择最近的未访问节点。

2. Huffman 编码

数据压缩使用 Huffman 编码以可变长度代码加密字符。使用贪婪算法，在每个阶段合并最不常见的字符来创建 Huffman 树。

3. 分数背包问题

在这个著名的优化问题中，目标是通过选择一组具有重量和价值的物品来在有限的重量容量内最大化总价值。通过选择价值重量比最高的物品，贪婪算法可以提供近似的答案。

贪婪算法的优点

1. 简洁性

贪婪算法的主要优点之一是其简洁性。它们易于理解、实现和分析，使其成为以时间高效的方式解决问题的首选。

2. 效率

贪婪算法通常具有出色的时间和空间复杂度，使其适用于实时应用程序和具有大型数据集的场景。

贪婪算法的局限性

虽然贪婪算法很强大，但它们并不适用于所有问题。它们存在一些固有的局限性：

1. 缺乏全局最优性

贪婪算法基于局部最优做出决策，而不考虑长期后果。因此，它们可能无法始终产生全局最优解。

2. 无回溯

在贪婪算法中，一旦做出选择，就无法撤销。如果早期决策后来导致次优解，则没有机制可以回溯并纠正它。

贪婪算法通过在每个阶段选择局部最优选项来快速有效地解决优化问题。尽管它们存在固有的局限性并且可能无法始终保证全局最优解，但它们是计算机科学及其他许多领域的重要工具。掌握何时以及如何使用贪婪算法是一种技能，它可以带来各种现实世界场景中优美而实用的解决方案。

下一主题C++ 中的最大乘积子数组

← 上一个下一个 →

C++ kruskal's 算法

历史

理解基础知识

树的类型

实际应用