### Hadoop2.x 环境搭建详解
#### 一、概述
Hadoop 是一款开源软件框架,用于分布式存储和处理大型数据集。Hadoop 的核心组件包括 HDFS(Hadoop Distributed File System) 和 MapReduce。将详细介绍 Hadoop2.x 环境的搭建过程,并提供一系列基本操作指导。
#### 二、准备工作
在开始安装 Hadoop 之前,需要完成以下准备工作:
##### 1. Linux 环境配置
- 修改主机名:确保主机名符合规范(不能以数字开头,不能包含特殊字符)。
- 执行命令:
vi /etc/sysconfig/network
- 查看配置:
cat /etc/sysconfig/network
- 主机映射:通过编辑
/etc/hosts
文件添加主机名映射。 - Linux 下执行:
vi /etc/hosts
- 添加行:
ip地址 主机名
- Windows 下的主机映射文件路径:
C:/windows/system32/drivers/etc/hosts
- 网络配置:确保网络配置正确。
- 查看网络配置文件:
cat /etc/sysconfig/network-scripts/ifcfg-eth0
- 确认
ONBOOT
参数设置为yes
,表示开机自启网卡;BOOTPROTO
设置为static
,表示使用静态 IP。
##### 2. JDK 安装
- 推荐使用单一用户(非 root 用户),如
hadoop
。 - 创建目录:
mkdir /opt/software /opt/modules
- 存放位置:
/opt/software
:用于存放.tar.gz
等软件包。/opt/modules
:用于存放已安装的软件。- 权限设置:
chown -R hadoop:hadoop /opt/modules /opt/software/
- 安装 JDK:
- 解压:
tar -zxf jdk-7u67-linux-x64.tar.gz -C ../modules/
- 配置环境变量:
- 编辑
/etc/profile
:bash export JAVA_HOME=/opt/modules/jdk1.7.0_67 export PATH=$PATH:$JAVA_HOME/bin