CDH5.5.7 离线部署文档
软件介绍
- CDH: Cloudera Distributed Hadoop,由Cloudera公司重新打包的Hadoop版本。相比原生Hadoop,CDH增加了更多功能和服务,提升了系统稳定性和易用性,使其更加适合企业部署。
- Cloudera Manager: Cloudera提供的Hadoop集群管控平台,简化集群的部署、管理与监控,管理员可以通过它轻松完成集群搭建和管理。
环境准备
- 集群规划:需根据部署需求提前规划服务器的配置,包括CPU、内存、磁盘等,确保符合CDH的运行要求。同时,明确每台服务器的集群角色,如Master节点、Worker节点。
环境部署步骤
- MySQL 下载
- 下载MySQL客户端和服务器端的RPM包,例如MySQL-client-5.6.25-1.el6.x86_64.rpm和MySQL-server-5.6.25-1.el6.x86_64.rpm,用于Cloudera Manager的后端存储。
-
下载mysql-connector-java-5.1.36.zip文件,以确保Java应用可以与MySQL数据库连接。
-
JDK 下载
-
获取JDK-7u71-linux-x64.tar.gz,以安装Java运行环境,作为Hadoop和Cloudera Manager运行的前提条件之一。
-
CDH 下载
- 从Cloudera归档服务器下载Cloudera Manager的安装包,如cloudera-manager-el6-cm5.3.4_x86_64.tar.gz。
-
根据需要下载相关的RPM包和Parcel文件,以便安装CDH组件和服务。
-
JDK 安装
- 在所有节点上检查并卸载可能已安装的OpenJDK,使用
rpm -qa | grep jdk
命令确认是否存在OpenJDK包,如有则需先卸载。 - 卸载后,执行JDK的安装。