9.8推测执行在分布式集群环境中,因程序Bug(包括Hadoop本身的bug)、负载不均衡或资源分布不均等原因,可能导致同一作业的多个任务运行速度不同步。为避免这种情况,Hadoop引入了推测执行(Speculative Execution)机制,通过启动备份任务处理拖后腿的任务,最终选用最先成功完成的任务结果。配置方法:在Hadoop的mapred-site.xml文件中进行相应参数设置。