Hive基本操作命令大全

Hive是一个基于Hadoop的数据仓库工具,支持使用SQL查询和管理大规模数据。将详细介绍Hive的基本操作命令,从创建表加载数据查询数据数据管理等方面进行整理。

创建表

Hive提供了多种方式创建表,例如:

- 创建一个简单的表:

sql

CREATE TABLE pokes (foo INT, bar STRING);

- 创建一个结构相同的新表:

sql

CREATE TABLE new_table LIKE records;

- 创建一个分区表:

sql

CREATE TABLE logs(ts BIGINT, line STRING) PARTITIONED BY (dt STRING, country STRING);

加载数据

Hive提供了多种方式加载数据,例如:

- 从本地文件加载数据:

sql

LOAD DATA LOCAL INPATH '/home/hadoop/input/hive/partitions/file1' INTO TABLE logs PARTITION(dt='2001-01', country='GB');

- 从HDFS加载数据:

sql

LOAD DATA INPATH '/user/hadoop/input/hive/partitions/file1' INTO TABLE logs PARTITION(dt='2001-01', country='GB');

查询数据

常用查询操作如下:

- 显示表中的所有分区:

sql

SHOW PARTITIONS logs;

- 显示所有表:

sql

SHOW TABLES;

- 显示表的结构信息:

sql

DESCRIBE invites;

- 查询数据:

sql

SELECT * FROM records;

数据管理

数据管理命令示例如下:

- 更新表的名称:

sql

ALTER TABLE source RENAME TO target;

- 添加新的一列:

sql

ALTER TABLE invites ADD COLUMNS (new_col2 INT COMMENT 'a comment');

- 删除表:

sql

DROP TABLE records;

- 删除表中的数据但保留表结构:

shell

dfs -rmr /user/hive/warehouse/records;