Apache Pig UNION 运算符

2025 年 3 月 17 日 | 阅读 1 分钟

Apache Pig UNION 运算符用于计算两个或多个关系的并集。它不维护元组的顺序。 它也不会删除重复的元组。

UNION 运算符示例

在本例中,我们计算了两个关系的数据。

执行 UNION 运算符的步骤

  • 在您的本地计算机上创建一个文本文件,并在其中写入一些值。
Apache Pig UNION Operator
  • 在您的本地计算机上创建另一个文本文件,并在其中写入一些值。
Apache Pig UNION Operator
  • 检查在两个文本文件中写入的值。
Apache Pig UNION Operator
  • 将两个文本文件上传到 HDFS 的特定目录中。
  • 打开 pig MapReduce 运行模式。
  • 加载包含数据的文。
  • 现在,执行并验证数据。
Apache Pig UNION Operator
  • 加载包含数据的另一个文件。
  • 现在,执行并验证数据。
Apache Pig UNION Operator
  • 让我们在两个文件之间执行并集操作。
  • 现在,执行并验证数据。
Apache Pig UNION Operator

在这里,我们得到了期望的输出。

下一个主题AVG 函数