星环Hyperbase是基于星环大数据平台的一种分布式NewSQL数据库,结合了NoSQL的水平扩展能力与传统关系数据库的事务处理能力,非常适合处理海量数据。本知识点主要介绍Hyperbase的基础操作方法,包括以下步骤:

1. 进入Hyperbase命令行

要进入Hyperbase,首先启动TDHClient,然后使用hbaseshell命令进入Hyperbase的命令行界面。TDHClient是星环大数据平台的一部分,负责Hadoop集群的部署、监控和维护。

2. 创建表与插入数据

通过hbase shell执行create语句创建表,例如表名为table_student_name,指定列族为cf。使用put命令插入数据,包括行键、列族、列标识符及对应的值。

3. 读取数据

get命令读取特定行数据;用scan命令读取多行数据,可通过LIMIT参数限制行数。count命令用于统计行数。

4. 修改表属性

通过disable下线表,使用alter更改表属性,如列族压缩和数据块编码方式。更改后用enable上线并用desc查看确认。

5. 分裂与压缩表

使用put插入数据,flush命令将数据写入磁盘。split命令用于分裂大表,compactmajor_compact执行局部与全局压缩,优化存储。

6. 导出表属性

使用describeInJson命令将表属性导出为JSON文件,通过Linux命令查看文件内容。确保TDHClient正确安装,并设置集群访问授权。

Waterdrop是一款数据集成工具,可在TDHClient上运行,进一步简化数据处理。