### Hadoop2.x 环境搭建详解

#### 一、概述

Hadoop 是一款开源软件框架,用于分布式存储和处理大型数据集。Hadoop 的核心组件包括 HDFS(Hadoop Distributed File System)MapReduce。将详细介绍 Hadoop2.x 环境的搭建过程,并提供一系列基本操作指导。

#### 二、准备工作

在开始安装 Hadoop 之前,需要完成以下准备工作:

##### 1. Linux 环境配置

  • 修改主机名:确保主机名符合规范(不能以数字开头,不能包含特殊字符)。
  • 执行命令:vi /etc/sysconfig/network
  • 查看配置:cat /etc/sysconfig/network
  • 主机映射:通过编辑 /etc/hosts 文件添加主机名映射。
  • Linux 下执行:vi /etc/hosts
  • 添加行:ip地址 主机名
  • Windows 下的主机映射文件路径:C:/windows/system32/drivers/etc/hosts
  • 网络配置:确保网络配置正确。
  • 查看网络配置文件:cat /etc/sysconfig/network-scripts/ifcfg-eth0
  • 确认 ONBOOT 参数设置为 yes,表示开机自启网卡;BOOTPROTO 设置为 static,表示使用静态 IP。

##### 2. JDK 安装

  • 推荐使用单一用户(非 root 用户),如 hadoop
  • 创建目录
  • mkdir /opt/software /opt/modules
  • 存放位置
  • /opt/software:用于存放 .tar.gz 等软件包。
  • /opt/modules:用于存放已安装的软件。
  • 权限设置
  • chown -R hadoop:hadoop /opt/modules /opt/software/
  • 安装 JDK
  • 解压:tar -zxf jdk-7u67-linux-x64.tar.gz -C ../modules/
  • 配置环境变量
  • 编辑 /etc/profilebash export JAVA_HOME=/opt/modules/jdk1.7.0_67 export PATH=$PATH:$JAVA_HOME/bin