Map阶段:读取输入数据并将其映射为键值对。

Shuffle和Sort阶段:对map产生的键值对进行分发、排序和分区。

Reduce阶段:对分好区的键值对进行聚合、规约和输出。

框架应用:

- Hadoop:MapReduce处理大规模数据的核心引擎。

- Hive:使用MapReduce在HDFS上执行SQL查询。

- HBase:使用MapReduce在HDFS上存储和处理大规模非关系数据。