星环Hyperbase是基于星环大数据平台的一种分布式NewSQL数据库,结合了NoSQL的水平扩展能力与传统关系数据库的事务处理能力,非常适合处理海量数据。本知识点主要介绍Hyperbase的基础操作方法,包括以下步骤:
1. 进入Hyperbase命令行
要进入Hyperbase,首先启动TDHClient,然后使用hbaseshell命令进入Hyperbase的命令行界面。TDHClient是星环大数据平台的一部分,负责Hadoop集群的部署、监控和维护。
2. 创建表与插入数据
通过hbase shell执行create
语句创建表,例如表名为table_student_name
,指定列族为cf。使用put
命令插入数据,包括行键、列族、列标识符及对应的值。
3. 读取数据
用get
命令读取特定行数据;用scan
命令读取多行数据,可通过LIMIT
参数限制行数。count
命令用于统计行数。
4. 修改表属性
通过disable
下线表,使用alter
更改表属性,如列族压缩和数据块编码方式。更改后用enable
上线并用desc
查看确认。
5. 分裂与压缩表
使用put
插入数据,flush
命令将数据写入磁盘。split
命令用于分裂大表,compact
与major_compact
执行局部与全局压缩,优化存储。
6. 导出表属性
使用describeInJson
命令将表属性导出为JSON文件,通过Linux命令查看文件内容。确保TDHClient正确安装,并设置集群访问授权。
Waterdrop是一款数据集成工具,可在TDHClient上运行,进一步简化数据处理。