Linux环境下Hive的安装部署是大数据处理中的关键步骤。Hive作为基于Hadoop的数据仓库工具,提供了数据分析的便捷性。以下是如何在Linux系统中安装和配置Hive的指南。

一、下载与解压安装包

  1. 下载cdh5.15.2版本的Hive安装包,地址:http://archive.cloudera.com/cdh5/cdh/5/1.2
  2. 下载完成后解压安装包。

二、配置环境变量

/etc/profile文件中添加如下内容,使Hive命令在任意路径可用:

export HIVE_HOME=/usr/app/hive-1.1.0-cdh5.15.2
export PATH=$HIVE_HOME/bin:$PATH

执行命令source /etc/profile以使配置生效。

三、编辑hive-env.sh配置文件

  1. 复制模板文件并编辑: bash cp hive-env.sh.template hive-env.sh vim hive-env.sh
  2. 在文件中指定Hadoop路径: bash HADOOP_HOME=/usr/app/hadoop-2.6.0-cdh5.15.2

四、配置Hive的hive-site.xml

创建并编辑hive-site.xml,内容如下:


  javax.jdo.option.ConnectionURL
  jdbc:mysql://hadoop001:3306/hadoop_hive?createDatabaseIfNotExist=true


  javax.jdo.option.ConnectionDriverName
  com.mysql.jdbc.Driver


  javax.jdo.option.ConnectionUserName
  root


  javax.jdo.option.ConnectionPassword
  root

此文件用于指定Hive连接MySQL的元数据存储地址、驱动、用户名和密码。

五、初始化元数据库

对于Hive 2.x版本,需手动初始化元数据库。初始化命令如下:

schematool -initSchema -dbType mysql

以上步骤完成后,Hive安装部署完毕,可以开始数据处理和查询任务。