几种可能导致数据倾斜的shuffer算子包括distinct(对RDD中的元素进行去重操作)、groupByKey(按相同key分组形成RDD[key,Iterable[value]])、reduceByKey(使用相关函数合并每个key的value值)、aggregateByKey(对PairRDD中相同Key的值进行聚合操作,使用中立初始值)、join(对需要连接的RDD进行内连接操作,对每个key下的元素进行笛卡尔积操作再展平)、cogroup(对多个共享同一键的RDD进行分组)、repartition(重新划分RDD的分区)...