Apache Pig运行模式

17 Mar 2025 | 阅读 2 分钟

Apache Pig以两种模式执行:本地模式和MapReduce模式。

Apache Pig Run Modes

本地模式

  • 它在单个JVM中执行,用于开发、实验和原型设计。
  • 在这里,文件使用localhost安装和运行。
  • 本地模式在本地文件系统上工作。输入和输出数据存储在本地文件系统中。

本地模式Grunt shell的命令

MapReduce模式

  • MapReduce模式也称为Hadoop模式。
  • 它是默认模式。
  • 在这种情况下,Pig将Pig Latin渲染为MapReduce作业,并在集群上执行它们。
  • 它可以在半分布式或完全分布式的Hadoop安装上执行。
  • 在这里,输入和输出数据存在于HDFS上。

MapReduce模式的命令

或者,

执行Pig程序的方式

以下是在本地和MapReduce模式下执行Pig程序的方式:-

  • 交互模式 - 在此模式下,Pig在Grunt shell中执行。要调用Grunt shell,请运行pig命令。一旦Grunt模式执行,我们就可以在命令行上交互地提供Pig Latin语句和命令。
  • 批处理模式 - 在此模式下,我们可以运行一个扩展名为.pig的脚本文件。这些文件包含Pig Latin命令。
  • 嵌入式模式 - 在此模式下,我们可以定义自己的函数。这些函数可以被称为UDF(用户定义函数)。在这里,我们使用Java和Python等编程语言。
下一主题Pig Latin概念