MapReduce 运行机制解析
示例:
假设输入数据包含两行文本:
- Hello World Bye World
- Hello Hadoop Goodbye Hadoop
Map 阶段:
Map 任务会逐行处理输入数据,生成键值对。
例如:
- Hello World Bye World -> < Hello> < World> < Bye> < World>
- Hello Hadoop Goodbye Hadoop -> < Hello> < Hadoop> < Goodbye> < Hadoop>
Reduce 阶段:
Reduce 任务会对相同键的键值对进行合并,统计每个单词出现的次数。
最终输出结果为:
- < Bye>
- < Goodbye>
- < Hadoop>
- < Hello>
- < World>