Map阶段:读取输入数据并将其映射为键值对。
Shuffle和Sort阶段:对map产生的键值对进行分发、排序和分区。
Reduce阶段:对分好区的键值对进行聚合、规约和输出。
框架应用:
- Hadoop:MapReduce处理大规模数据的核心引擎。
- Hive:使用MapReduce在HDFS上执行SQL查询。
- HBase:使用MapReduce在HDFS上存储和处理大规模非关系数据。
Map阶段:读取输入数据并将其映射为键值对。
Shuffle和Sort阶段:对map产生的键值对进行分发、排序和分区。
Reduce阶段:对分好区的键值对进行聚合、规约和输出。
框架应用:
- Hadoop:MapReduce处理大规模数据的核心引擎。
- Hive:使用MapReduce在HDFS上执行SQL查询。
- HBase:使用MapReduce在HDFS上存储和处理大规模非关系数据。