• 对数据进行分区或排序
  • 使用随机数分区
  • 使用数据倾斜过滤器
  • 对UDF进行缓存
  • 优化任务调度