Storm提供了一组通用原语,用于分布式实时计算中的流处理,实时处理消息并更新数据库。这是一种管理队列及工作者集群的方式。Storm还支持连续计算,对数据流进行连续查询,并在计算时将结果以流的形式输出给用户。此外,它可用于分布式RPC,以并行方式运行复杂的计算。
apache-storm-0.9.6.tar.gz
相关推荐
apache-hive-0.13.1-bin.tar.gz
Hive是基于Hadoop的数据仓库工具,可将结构化数据文件映射为数据库表,提供简单的SQL查询功能,能将SQL语句转换为MapReduce任务运行。其优点是学习成本低,通过类SQL语句快速实现简单的MapReduce统计,无需开发专门的MapReduce应用,非常适合数据仓库的统计分析。
Hive
1
2024-07-12
apache-tez-0.9.0-bin.tar.gz
Tez是Apache推出的DAG计算框架,它源于MapReduce框架。核心思想是将Map和Reduce操作拆分为更小的元操作,如Map拆分为Input、Processor、Sort、Merge和Output,Reduce拆分为Input、Shuffle、Sort、Merge、Processor和Output。这些元操作可以灵活组合形成新的操作,最终组装成一个大的DAG作业。Tez的主要特点包括: (1)Apache二级开源项目 (2)运行在YARN之上 (3)适用于DAG应用,可替代Hive/Pig。
Hive
3
2024-07-13
apache-hive-2.3.4-bin.tar.gz
Apache Hive是大数据处理领域的一个重要组件,专门用于查询、分析和管理结构化及半结构化数据。Hive基于Hadoop开发,提供类似SQL的Hive Query Language(HQL),使非程序员也能轻松进行大数据分析。Apache Hive 2.3.4是该项目的稳定版本,包含多项性能优化和改进。Hive的核心概念包括元数据管理、HQL查询语言、支持多种文件格式的Hive表、分区和桶优化策略、以及多种执行引擎选择。
Hive
0
2024-10-21
flink.tar.gz
Apache Flink 是一个开源的流处理框架,具有高吞吐量和低延迟的特性。它支持在内存中保持数据状态,并能够处理数据流和批处理任务。Flink 提供了丰富的API和库,可以用于复杂的数据流处理应用程序。
flink
1
2024-07-30
Redis tcl8.6.6-src.tar.gz redis-stable.tar.gz
安装Redis所需的tcl组件,8.6.6版本为最新。文件包括Redis tcl8.6.6-src.tar.gz和redis-stable.tar.gz。
Redis
2
2024-07-12
sqlite-3.8.5.tar.gz 和 sqlite-autoconf-3080500.tar.gz
sqlite-autoconf-3080500.tar.gz 包含了 SQLite 3.8.5 的合并文件、配置脚本和构建用的 makefile。同时,tarball 的 tea 子目录中还包含了与 Tcl 扩展架构(TEA)兼容的配置脚本和 makefile,用于构建 SQLite 的 TCL 绑定。
SQLite
3
2024-07-13
apache-mrunit-1.1.0-hadoop2-bin.tar.gz使用指南
下载的Hadoop2单元测试工具apache-mrunit-1.1.0-hadoop2-bin.tar.gz,其使用方式与JUnit相似。需要此工具的朋友可以直接下载使用。
Hadoop
0
2024-11-05
redis-4.0.10.tar.gz
Redis是一款开源的键值存储系统,由Salvatore Sanfilippo编写。该系统支持多种数据结构,包括字符串、哈希、列表、集合和有序集合。
Redis
4
2024-04-30
Hadoop-2.7.5.tar.gz
基于CentOS-6.7编译,使用了Protobuf、Ant、Findbugs、Maven等工具。
Hadoop
4
2024-05-13