Apache Pig COUNT 函数

2025 年 3 月 17 日 | 阅读 1 分钟

Apache Pig COUNT 函数用于计算一个 bag 中的元素数量。它需要一个前置的 GROUP ALL 语句用于全局计数,以及一个 GROUP BY 语句用于分组计数。它会忽略 null 值。

COUNT 函数的示例

在这个例子中,我们计算 bag 中的元组数量。

执行 COUNT 函数的步骤

  • 在您的本地机器上创建一个文本文件,并插入元组列表。
Apache Pig COUNT Function
  • 检查插入到文本文件中的元组。
Apache Pig COUNT Function
  • 将文本文件上传到 HDFS 的特定目录中。
  • 打开 pig MapReduce 运行模式。
  • 加载包含数据的文。
  • 现在,执行并验证数据。
Apache Pig COUNT Function
  • 让我们基于 'a1' 字段对数据进行分组。
Apache Pig COUNT Function
  • 让我们返回给定元组的计数。
Apache Pig COUNT Function

在这里,我们得到了期望的输出。

下一主题IN 函数