Hive是基于Hadoop的数据仓库工具,可将结构化数据文件映射为数据库表,提供简单的SQL查询功能,能将SQL语句转换为MapReduce任务运行。其优点是学习成本低,通过类SQL语句快速实现简单的MapReduce统计,无需开发专门的MapReduce应用,非常适合数据仓库的统计分析。
apache-hive-0.13.1-bin.tar.gz
相关推荐
apache-tez-0.9.0-bin.tar.gz
Tez是Apache推出的DAG计算框架,它源于MapReduce框架。核心思想是将Map和Reduce操作拆分为更小的元操作,如Map拆分为Input、Processor、Sort、Merge和Output,Reduce拆分为Input、Shuffle、Sort、Merge、Processor和Output。这些元操作可以灵活组合形成新的操作,最终组装成一个大的DAG作业。Tez的主要特点包括: (1)Apache二级开源项目 (2)运行在YARN之上 (3)适用于DAG应用,可替代Hive/Pig。
Hive
3
2024-07-13
hbase-1.2.6.1-bin.tar.gz
hbase-1.2.6.1-bin.tar.gz,hbase-1.2.6.1-bin.tar.gz
Hbase
2
2024-07-12
hbase-2.0.2.3.1.4.0-315-bin.tar.gz
在ambari-2.7.5编译过程中,hbase-2.0.2.3.1.4.0-315-bin.tar.gz下载速度较慢,因此需提前准备。此外,还包含hadoop-3.1.1.3.1.4.0-315.tar.gz、grafana-6.4.2.linux-amd64.tar.gz、phoenix-5.0.0.3.1.4.0-315.tar.gz。
Hbase
2
2024-07-12
apache-storm-0.9.6.tar.gz
Storm提供了一组通用原语,用于分布式实时计算中的流处理,实时处理消息并更新数据库。这是一种管理队列及工作者集群的方式。Storm还支持连续计算,对数据流进行连续查询,并在计算时将结果以流的形式输出给用户。此外,它可用于分布式RPC,以并行方式运行复杂的计算。
Storm
2
2024-07-13
parquet-tools-0.1.0-bin.tar.gz 下载
parquet-tools-0.1.0-bin.tar.gz 可供下载。
统计分析
6
2024-05-20
apache-flume-1.9.0-bin.tar.zip 下载
apache-flume-1.9.0-bin.tar.zip
Hadoop
2
2024-05-20
hbase-2.1.7-bin.tar.gz 资源有效性确认
该资源已经过测试,确认可以正常使用。
Hbase
4
2024-05-12
flink.tar.gz
Apache Flink 是一个开源的流处理框架,具有高吞吐量和低延迟的特性。它支持在内存中保持数据状态,并能够处理数据流和批处理任务。Flink 提供了丰富的API和库,可以用于复杂的数据流处理应用程序。
flink
1
2024-07-30
探索 Hive 0.13.1-cdh5.3.6 功能
Hive 0.13.1-cdh5.3.6 功能概览
该版本 Hive 兼容 CDH5.3.6,并带来一系列功能增强和问题修复,例如:
性能优化: 提升查询速度和效率。
稳定性提升: 修复已知问题,增强系统稳定性。
功能扩展: 引入新的分析函数和工具。
使用场景
Hive 适用于大规模数据集的批处理分析,例如:
日志分析
数据仓库
商业智能
获取方式
该资源包可从 Cloudera 官网获取。
Hive
3
2024-04-29