《深入理解SPARK:核心思想与源码分析》通过大量图例和实例,详细解析了Spark的架构、部署模式、工作模块的设计理念、实现源码及使用技巧。此书针对Spark1.2.0版本的源码进行了全面分析,为Spark的优化、定制和扩展提供理论指导。书中分为三部分:准备篇(第1~2章),涵盖了Spark的环境搭建、设计理念及基本架构;核心设计篇(第3~7章),深入探讨了SparkContext的初始化、存储体系、任务提交与执行、计算引擎及部署模式的原理与源码分析,使读者能深入理解Spark的核心设计与实现,快速解决线上问题并进行性能优化;扩展篇(第8~11章),详述了基于Spark核心的各种扩展及应用,包括SQL处理引擎、Hive处理、流式计算框架Spark Streaming、图计算框架GraphX、机器学习库MLlib等内容,帮助读者在实际项目中扩展Spark的应用场景。