Hadoop的核心是HDFS(Hadoop分布式文件系统)和MapReduce,它能够可靠、高效、可伸缩地处理海量数据。
Hadoop特性:
- 高可靠性
- 高效性
- 高可扩展性
- 高容错性
- 成本低
- 运行在Linux平台上
- 支持多种编程语言
Hadoop生态系统:
除了HDFS和MapReduce,Hadoop生态系统还包含其他组件,例如Hive和HBase:
- Hive: 基于Hadoop的数据仓库工具,提供类似SQL的查询语言,方便数据分析。
- HBase: 构建在HDFS之上的分布式、可伸缩、高可靠性的NoSQL数据库,适用于实时读写大数据。