HiveQL - ORDER BY 和 SORT BY 子句

17 Mar 2025 | 阅读 2 分钟

通过使用 HiveQL ORDER BY 和 SORT BY 子句,我们可以对列应用排序。它返回升序或降序排列的结果集。 在这里,我们将对下表中的记录执行这些子句

HiveQL - ORDER BY and SORT BY Clause

HiveQL - ORDER BY 子句

在 HiveQL 中,ORDER BY 子句对查询结果集执行完整的排序。 因此,完整的数据通过单个 reducer 传递。 在执行大型数据集时,这可能需要很长时间。 但是,我们可以使用 LIMIT 来最大限度地缩短排序时间。

Hive 中 ORDER BY 子句的示例

让我们看一个例子,通过使用 ORDER BY 子句按排序顺序排列数据。

  • 选择我们要创建表的数据库。

HiveQL - ORDER BY and SORT BY Clause
  • 现在,使用以下命令创建一个表

HiveQL - ORDER BY and SORT BY Clause
  • 将数据加载到表中。

HiveQL - ORDER BY and SORT BY Clause
  • 现在,使用以下命令以降序方式获取数据

HiveQL - ORDER BY and SORT BY Clause
HiveQL - ORDER BY and SORT BY Clause
HiveQL - ORDER BY and SORT BY Clause

在这里,我们得到了想要的结果。

HiveQL - SORT BY 子句

HiveQL SORT BY 子句是 ORDER BY 子句的替代方法。 它对每个 reducer 中的数据进行排序。 因此,它执行本地排序,其中每个 reducer 的输出都是单独排序的。 它也可能给出部分排序的结果。

Hive 中 SORT BY 子句的示例

在这个例子中,我们通过使用 SORT BY 子句按排序顺序排列数据。

  • 让我们使用以下命令以降序方式获取数据

HiveQL - ORDER BY and SORT BY Clause
HiveQL - ORDER BY and SORT BY Clause
HiveQL - ORDER BY and SORT BY Clause

在这里,我们得到了想要的结果。

下一个主题HiveQL - JOIN