Hive基本操作命令大全
Hive是一个基于Hadoop的数据仓库工具,支持使用SQL查询和管理大规模数据。将详细介绍Hive的基本操作命令,从创建表、加载数据、查询数据到数据管理等方面进行整理。
创建表
Hive提供了多种方式创建表,例如:
- 创建一个简单的表:
sql
CREATE TABLE pokes (foo INT, bar STRING);
- 创建一个结构相同的新表:
sql
CREATE TABLE new_table LIKE records;
- 创建一个分区表:
sql
CREATE TABLE logs(ts BIGINT, line STRING) PARTITIONED BY (dt STRING, country STRING);
加载数据
Hive提供了多种方式加载数据,例如:
- 从本地文件加载数据:
sql
LOAD DATA LOCAL INPATH '/home/hadoop/input/hive/partitions/file1' INTO TABLE logs PARTITION(dt='2001-01', country='GB');
- 从HDFS加载数据:
sql
LOAD DATA INPATH '/user/hadoop/input/hive/partitions/file1' INTO TABLE logs PARTITION(dt='2001-01', country='GB');
查询数据
常用查询操作如下:
- 显示表中的所有分区:
sql
SHOW PARTITIONS logs;
- 显示所有表:
sql
SHOW TABLES;
- 显示表的结构信息:
sql
DESCRIBE invites;
- 查询数据:
sql
SELECT * FROM records;
数据管理
数据管理命令示例如下:
- 更新表的名称:
sql
ALTER TABLE source RENAME TO target;
- 添加新的一列:
sql
ALTER TABLE invites ADD COLUMNS (new_col2 INT COMMENT 'a comment');
- 删除表:
sql
DROP TABLE records;
- 删除表中的数据但保留表结构:
shell
dfs -rmr /user/hive/warehouse/records;