Spark 架构17 Mar 2025 | 阅读 2 分钟 Spark 采用主从架构。它的集群由一个主节点和多个从节点组成。 Spark 架构依赖于两个抽象概念
弹性分布式数据集 (RDD)弹性分布式数据集是一组数据项,可以存储在工作节点的内存中。这里,
我们稍后会详细了解 RDD。 有向无环图 (DAG)有向无环图是一个有限的有向图,它对数据执行一系列计算。每个节点都是一个 RDD 分区,边是对数据进行转换。在这里,图指的是导航,而有向和无环则指出了它的执行方式。 让我们了解一下 Spark 架构。 ![]() 驱动程序驱动程序是一个运行应用程序的 main() 函数并创建 SparkContext 对象的进程。SparkContext 的目的是协调 Spark 应用程序,这些应用程序作为独立的一组进程在集群上运行。 要在集群上运行,SparkContext 连接到不同类型的集群管理器,然后执行以下任务:-
集群管理器
工作节点
Executor
任务
下一个主题Spark 组件 |
我们请求您订阅我们的新闻通讯以获取最新更新。