Apache Pig MIN 函数

2025 年 3 月 17 日 | 阅读 1 分钟

Apache Pig 的 MIN 函数用于查找单个列包中数值或 chararray 的最小值。它需要一个前面的 GROUP ALL 语句来获得全局最小值,以及一个 GROUP BY 语句来获得组最小值。但是,它会忽略 NULL 值。

语法

此处,

exp - 这是一个表达式,具有 chararray、int、float、long 等数据类型。

MIN 函数的示例

在本例中,我们将找出给定值的最小值。

执行 MIN 函数的步骤

  • 在您的本地机器上创建一个文本文件,并插入元组列表。
Apache Pig MIN Function
  • 检查插入到文本文件中的元组。
Apache Pig MIN Function
  • 将文本文件上传到 HDFS 的特定目录中。
  • 打开 pig MapReduce 运行模式。
  • 加载包含数据的文。
  • 现在,执行并验证数据。
Apache Pig MIN Function
  • 让我们基于 'a1' 字段对数据进行分组。
Apache Pig MIN Function
  • 让我们返回给定数值的最小值。
Apache Pig MIN Function

在这里,我们得到了期望的输出。

下一个主题SIZE 函数