CDH5.5.7 离线部署文档

软件介绍

  • CDH: Cloudera Distributed Hadoop,由Cloudera公司重新打包的Hadoop版本。相比原生Hadoop,CDH增加了更多功能和服务,提升了系统稳定性和易用性,使其更加适合企业部署。
  • Cloudera Manager: Cloudera提供的Hadoop集群管控平台,简化集群的部署、管理与监控,管理员可以通过它轻松完成集群搭建和管理。

环境准备

  • 集群规划:需根据部署需求提前规划服务器的配置,包括CPU、内存、磁盘等,确保符合CDH的运行要求。同时,明确每台服务器的集群角色,如Master节点、Worker节点。

环境部署步骤

  1. MySQL 下载
  2. 下载MySQL客户端和服务器端的RPM包,例如MySQL-client-5.6.25-1.el6.x86_64.rpm和MySQL-server-5.6.25-1.el6.x86_64.rpm,用于Cloudera Manager的后端存储。
  3. 下载mysql-connector-java-5.1.36.zip文件,以确保Java应用可以与MySQL数据库连接。

  4. JDK 下载

  5. 获取JDK-7u71-linux-x64.tar.gz,以安装Java运行环境,作为Hadoop和Cloudera Manager运行的前提条件之一。

  6. CDH 下载

  7. 从Cloudera归档服务器下载Cloudera Manager的安装包,如cloudera-manager-el6-cm5.3.4_x86_64.tar.gz。
  8. 根据需要下载相关的RPM包和Parcel文件,以便安装CDH组件和服务。

  9. JDK 安装

  10. 在所有节点上检查并卸载可能已安装的OpenJDK,使用rpm -qa | grep jdk命令确认是否存在OpenJDK包,如有则需先卸载。
  11. 卸载后,执行JDK的安装。