MapReduce 运行机制解析

示例:

假设输入数据包含两行文本:

  • Hello World Bye World
  • Hello Hadoop Goodbye Hadoop

Map 阶段:

Map 任务会逐行处理输入数据,生成键值对。

例如:

  • Hello World Bye World -> < Hello> < World> < Bye> < World>
  • Hello Hadoop Goodbye Hadoop -> < Hello> < Hadoop> < Goodbye> < Hadoop>

Reduce 阶段:

Reduce 任务会对相同键的键值对进行合并,统计每个单词出现的次数。

最终输出结果为:

  • < Bye>
  • < Goodbye>
  • < Hadoop>
  • < Hello>
  • < World>