Hadoop 以 MapReduce 计算模式为基础,是一个开源且分布式的并行编程架构,可轻松处理海量数据。

Hadoop 具有以下主要组件:

- HDFS:分布式文件系统,用于存储数据。

- HBase:分布式数据库,用于部署数据。

- MapReduce:数据处理引擎。