Apache Pig GROUP 操作符

2025 年 3 月 17 日 | 阅读 1 分钟

Apache Pig GROUP 操作符用于对一个或多个关系中的数据进行分组。它将包含相似分组键的元组进行分组。如果分组键包含多个字段,则将其视为元组,否则它将与分组键的类型相同。结果是提供一个关系,其中每个组包含一个元组。

GROUP 操作符的示例

在此示例中,我们根据姓氏对给定数据进行分组。

执行 Group 操作符的步骤

  • 在您的本地计算机上创建一个文本文件,并在其中写入一些文本。
Apache Pig Group Operator
  • 检查 piginput2.txt 文件中编写的文本。
Apache Pig Group Operator
  • 将 piginput2.txt 文件上传到 HDFS 的特定目录中。
Apache Pig Group Operator
  • 打开 pig MapReduce 运行模式。
  • 将数据加载到 bag 中。
  • 现在执行并验证数据。
Apache Pig Group Operator
  • 让我们根据 l_name 对数据进行分组。
  • 现在,执行并验证数据。
Apache Pig Group Operator

在这里,我们得到了期望的输出。

下一话题LIMIT 操作符