Frank Kane 的《利用 Apache Spark 和 Python 驯服大数据》将手把手地带您学习 Apache Spark。Frank 将首先教您如何在单个系统或集群上设置 Spark,随后您将学习使用 Spark RDD 分析大型数据集,并使用 Python 快速开发和运行高效的 Spark 作业。

Apache Spark 已成为大数据领域的下一个热门技术——在短短几年内,它便从一项新兴技术迅速崛起为一颗耀眼的明星。Spark 允许您实时地从海量数据中快速提取可操作的见解,使其成为许多现代企业必不可少的工具。

Frank 在这本书中融入了超过 15 个与现实世界相关的互动式趣味示例,他将使您能够理解 Spark 生态系统,并轻松地实施生产级的实时 Spark 项目。