Hadoop 安装

2025 年 1 月 14 日 | 阅读 3 分钟

Hadoop 的环境要求: Hadoop 的生产环境是 UNIX,但也可以使用 Cygwin 在 Windows 中使用。 运行 Map Reduce 程序需要 Java 1.6 或更高版本。 对于在 UNIX 环境中从 tar 包安装 Hadoop,您需要

  1. Java 安装
  2. SSH 安装
  3. Hadoop 安装和文件配置

1) Java 安装

步骤 1. 在提示符中键入 "java -version" 以查找是否已安装 java。 如果没有,请从 http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html 下载 java。 tar 文件 jdk-7u71-linux-x64.tar.gz 将被下载到您的系统。

步骤 2. 使用以下命令提取文件

步骤 3. 为了让 UNIX 的所有用户都能使用 java,请将该文件移动到 /usr/local 并设置路径。 在提示符中切换到 root 用户,然后键入以下命令将 jdk 移动到 /usr/lib。

现在,在 ~/.bashrc 文件中添加以下命令以设置路径。

现在,您可以通过在提示符中键入 "java -version" 来检查安装。

2) SSH 安装

SSH 用于与主从计算机交互,无需密码提示。 首先,在主从系统上创建一个 Hadoop 用户

要映射节点,请打开所有机器上 /etc/ 文件夹中存在的 hosts 文件,并将 IP 地址以及它们的主机名放入其中。

输入以下行

在每个节点中设置 SSH 密钥,以便它们可以在彼此之间进行通信而无需密码。 相同的命令是

3) Hadoop 安装

可以从 http://developer.yahoo.com/hadoop/tutorial/module3.html 下载 Hadoop

现在提取 Hadoop 并将其复制到一个位置。

更改 Hadoop 文件夹的所有权

更改 Hadoop 配置文件

所有文件都位于 /usr/local/Hadoop/etc/hadoop 中

1) 在 hadoop-env.sh 文件中添加

2) 在 core-site.xml 中添加以下内容,在配置选项卡之间

3) 在 hdfs-site.xml 中添加以下内容,在配置选项卡之间

4) 打开 Mapred-site.xml 并进行如下所示的更改

5) 最后,更新您的 $HOME/.bahsrc

在从属机器上使用以下命令安装 Hadoop

配置主节点和从属节点

之后,格式化名称节点并启动所有守护程序

最简单的步骤是使用 cloudera,因为它附带了所有预先安装的内容,可以从 http://content.udacity-data.com/courses/ud617/Cloudera-Udacity-Training-VM-4.1.1.c.zip 下载

下一主题Hadoop 堆栈