Tez是Apache推出的DAG计算框架,它源于MapReduce框架。核心思想是将Map和Reduce操作拆分为更小的元操作,如Map拆分为Input、Processor、Sort、Merge和Output,Reduce拆分为Input、Shuffle、Sort、Merge、Processor和Output。这些元操作可以灵活组合形成新的操作,最终组装成一个大的DAG作业。Tez的主要特点包括: (1)Apache二级开源项目 (2)运行在YARN之上 (3)适用于DAG应用,可替代Hive/Pig。