Hadoop的核心是HDFS(Hadoop分布式文件系统)和MapReduce,它能够可靠、高效、可伸缩地处理海量数据。

Hadoop特性:

  • 高可靠性
  • 高效性
  • 高可扩展性
  • 高容错性
  • 成本低
  • 运行在Linux平台上
  • 支持多种编程语言

Hadoop生态系统:

除了HDFS和MapReduce,Hadoop生态系统还包含其他组件,例如Hive和HBase:

  • Hive: 基于Hadoop的数据仓库工具,提供类似SQL的查询语言,方便数据分析。
  • HBase: 构建在HDFS之上的分布式、可伸缩、高可靠性的NoSQL数据库,适用于实时读写大数据。