Apache Pig FOREACH 算子

2025 年 3 月 17 日 | 阅读 1 分钟

Apache Pig FOREACH 算子根据数据列生成数据转换。建议使用 FILTER 操作来处理数据元组。

FOREACH 算子示例

在本例中,我们遍历给定文件中的两列数据。

执行 FOREACH 算子的步骤

  • 在您的本地计算机上创建一个文本文件,并为其提供一些值。
Apache Pig FOREACH Operator
  • 检查写入文本文件中的值。
Apache Pig FOREACH Operator
  • 将文本文件上传到 HDFS 的特定目录中。
  • 打开 pig MapReduce 运行模式。
  • 加载包含数据的文。
  • 现在,执行并验证数据。
Apache Pig FOREACH Operator
  • 让我们遍历两列的数据。
Apache Pig FOREACH Operator

在这里,我们得到了期望的输出。

下一个主题GROUP 算子