• 解释 Spark 在大数据和 Hadoop 生态系统中的作用
  • 使用不同部署模式创建 Spark 集群
  • 控制和优化 Spark 集群和应用程序的运行
  • 掌握 Spark Core RDD API 编程技术
  • 使用高级 API 平台结构(包括共享变量、RDD 存储和分区)扩展、加速和优化 Spark 程序
  • 高效地将 Spark 与 SQL 和非关系数据存储集成
  • 使用 Spark Streaming 和 Apache Kafka 执行流处理和消息传递
  • 使用 SparkR 和 Spark MLlib 实现预测建模