启动 Sqoop

2025 年 3 月 17 日 | 阅读 1 分钟

Sqoop 是一个命令行工具,具有以下结构

  • TOOL 表示操作,例如:"import", "export"。
  • PROPERTY_ARGS 是 Java 属性,格式为 "-Dname=value"
  • SQOOP_ARGS 提及各种 Sqoop 参数
  • EXTRA_ARGS 用于专用的连接器,使用 "--" 与 SQOOP_ARGS 分隔

示例

键入 "sqoop help" 以获取所有可用的工具

Sqoop command

后端发生了什么

当您决定将数据从 RDBMS 移动到 HDFS 时,首先要使用的产品是 Apache Sqoop。 当您请求将数据导入 HDFS 时,会发生以下情况。

  1. Sqoop 从关系数据库请求元数据信息。
  2. 关系数据库返回所需请求。
  3. 根据元数据信息,Sqoop 生成 Java 类。
  4. 基于主键,在表中发生分区,因为多个映射器将同时导入数据。
下一主题Sqoop 导入