Hadoop 安装

2025 年 1 月 14 日 | 阅读 3 分钟

Hadoop 的环境要求： Hadoop 的生产环境是 UNIX，但也可以使用 Cygwin 在 Windows 中使用。运行 Map Reduce 程序需要 Java 1.6 或更高版本。对于在 UNIX 环境中从 tar 包安装 Hadoop，您需要

Java 安装
SSH 安装
Hadoop 安装和文件配置

1) Java 安装

步骤 1. 在提示符中键入 "java -version" 以查找是否已安装 java。如果没有，请从 http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html 下载 java。 tar 文件 jdk-7u71-linux-x64.tar.gz 将被下载到您的系统。

步骤 2. 使用以下命令提取文件

步骤 3. 为了让 UNIX 的所有用户都能使用 java，请将该文件移动到 /usr/local 并设置路径。在提示符中切换到 root 用户，然后键入以下命令将 jdk 移动到 /usr/lib。

现在，在 ~/.bashrc 文件中添加以下命令以设置路径。

# export JAVA_HOME=/usr/lib/jdk1.7.0_71
# export PATH=PATH:$JAVA_HOME/bin

现在，您可以通过在提示符中键入 "java -version" 来检查安装。

2) SSH 安装

SSH 用于与主从计算机交互，无需密码提示。首先，在主从系统上创建一个 Hadoop 用户

# useradd hadoop
# passwd Hadoop

要映射节点，请打开所有机器上 /etc/ 文件夹中存在的 hosts 文件，并将 IP 地址以及它们的主机名放入其中。

输入以下行

12.1.114    hadoop-master
12.1.121    hadoop-salve-one
12.1.143   hadoop-slave-two

在每个节点中设置 SSH 密钥，以便它们可以在彼此之间进行通信而无需密码。相同的命令是

# su hadoop 
$ ssh-keygen -t rsa 
$ ssh-copy-id -i ~/.ssh/id_rsa.pub tutorialspoint@hadoop-master 
$ ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop_tp1@hadoop-slave-1 
$ ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop_tp2@hadoop-slave-2 
$ chmod 0600 ~/.ssh/authorized_keys 
$ exit

3) Hadoop 安装

可以从 http://developer.yahoo.com/hadoop/tutorial/module3.html 下载 Hadoop

现在提取 Hadoop 并将其复制到一个位置。

$ mkdir /usr/hadoop
$ sudo tar vxzf  hadoop-2.2.0.tar.gz ?c /usr/hadoop

更改 Hadoop 文件夹的所有权

更改 Hadoop 配置文件

所有文件都位于 /usr/local/Hadoop/etc/hadoop 中

1) 在 hadoop-env.sh 文件中添加

2) 在 core-site.xml 中添加以下内容，在配置选项卡之间

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://hadoop-master:9000</value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
</configuration>

3) 在 hdfs-site.xml 中添加以下内容，在配置选项卡之间

<configuration>
<property>
<name>dfs.data.dir</name>
<value>usr/hadoop/dfs/name/data</value>
<final>true</final>
</property>
<property>
<name>dfs.name.dir</name>
<value>usr/hadoop/dfs/name</value>
<final>true</final>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

4) 打开 Mapred-site.xml 并进行如下所示的更改

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>hadoop-master:9001</value>
</property>
</configuration>

5) 最后，更新您的 $HOME/.bahsrc

cd $HOME
vi .bashrc
Append following lines in the end and save and exit
#Hadoop variables 
export JAVA_HOME=/usr/lib/jvm/jdk/jdk1.7.0_71
export HADOOP_INSTALL=/usr/hadoop
export PATH=$PATH:$HADOOP_INSTALL/bin 
export PATH=$PATH:$HADOOP_INSTALL/sbin
export HADOOP_MAPRED_HOME=$HADOOP_INSTALL 
export HADOOP_COMMON_HOME=$HADOOP_INSTALL
export HADOOP_HDFS_HOME=$HADOOP_INSTALL 
export YARN_HOME=$HADOOP_INSTALL

在从属机器上使用以下命令安装 Hadoop

# su hadoop 
$ cd /opt/hadoop 
$ scp -r hadoop hadoop-slave-one:/usr/hadoop 
$ scp -r hadoop hadoop-slave-two:/usr/Hadoop

配置主节点和从属节点

$ vi etc/hadoop/masters
hadoop-master

$ vi etc/hadoop/slaves
hadoop-slave-one 
hadoop-slave-two

之后，格式化名称节点并启动所有守护程序

# su hadoop 
$ cd /usr/hadoop 
$ bin/hadoop namenode -format

$ cd $HADOOP_HOME/sbin
$ start-all.sh

最简单的步骤是使用 cloudera，因为它附带了所有预先安装的内容，可以从 http://content.udacity-data.com/courses/ud617/Cloudera-Udacity-Training-VM-4.1.1.c.zip 下载

下一主题Hadoop 堆栈

我们提供所有技术（如 Java 教程、Android、Java 框架）的教程和面试问题

联系信息

G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India

hr@tpointtech.com

+91-9599086977

关注我们

Python

Java

.Net Framework

AI, ML and Data Science

Cloud Technology

B.Tech and MCA

Web Technology

PHP

Software Testing

Technical Interview

Java Interview

Python

Web Interview

Database Interview

B.Tech / MCA

Important Interview

Software Testing Interview

Company Interviews

Online Compilers

Multiple Choice Questions

Hadoop 教程

Hadoop 模块

Hadoop - MapReduce

HBase

Hive 教程

Pig

Sqoop

Spark 教程

其他

面试题

Hadoop 安装

1) Java 安装

2) SSH 安装

3) Hadoop 安装

相关帖子

Hadoop 教程

什么是大数据

Hadoop 堆栈

什么是 Hadoop

订阅 Tpoint Tech

联系信息

关注我们

教程

面试题

在线编译器