Apache Spark
Apache Spark 权威指南节选 R1.pdf
相关推荐
Apache Spark 机器学习 PDF
本资源提供 Apache Spark 机器学习 PDF 文档,供您免费学习和参考。
spark
11
2024-05-13
Apache Spark 全套 PDF 文档
此集合包含大量 Spark 数据的 PDF 文件,包括源码详细说明的书籍。如果您想深入了解 Spark,这些文档将为您提供有价值的技术支持。
spark
11
2024-04-30
Apache Spark编程入门指南
Spark编程指南是一本适合初学者的入门手册,涵盖了Apache Spark的核心概念和操作,帮助编程人员快速掌握Spark的使用并理解其生态系统。Apache Spark是一个快速、大规模、通用的计算引擎,提供了丰富的高级API,支持Java、Scala、Python和R等编程语言。Spark的设计目标是支持数据在内存中的处理,以提高数据处理速度,也被称为内存计算。与Hadoop MapReduce相比,Spark可以将作业中间结果保存在内存中,避免昂贵的磁盘I/O操作,大大提升处理效率。Spark编程的核心是围绕RDD(弹性分布式数据集)展开的,RDD是分布式内存的一个抽象概念,提供一个容
spark
14
2024-11-07
Apache Hadoop中文版权威指南
《Apache Hadoop权威指南》是大数据领域的经典著作,深入介绍了开源分布式计算框架Apache Hadoop。最初由Doug Cutting和Mike Cafarella创建,支持Google的MapReduce和GFS的开源实现。本书的中文版为读者提供了学习Hadoop的便利,深入理解其核心概念和技术。Hadoop核心包括两个主要组件:Hadoop Distributed File System (HDFS)和MapReduce。HDFS是高容错、可扩展的分布式文件系统,专为存储和处理海量数据而设计。MapReduce通过映射和化简两个阶段实现数据的并行处理。Name
Hadoop
7
2024-07-22
SQLite 权威指南:优化版 PDF
这份 SQLite 指南源自原始文档,经过 LibreOffice 和 Acrobat meticulous 的排版,呈现更清晰易读的格式。
SQLite
10
2024-04-30
Spark权威指南:深度解析与实践
深入探索Spark 2.0:大规模数据处理的利器
欢迎踏入Spark 2.0的世界!本书将引领您全面了解Apache Spark,聚焦于Spark 2.0中引入的新一代API。作为当前最受欢迎的大规模数据处理系统之一,Apache Spark提供了多种编程语言的API,并拥有丰富的内置和第三方库。
自2009年诞生于加州大学伯克利分校,到2013年加入Apache软件基金会,Spark开源社区不断发展壮大,为其打造了更强大的API和高级库。因此,我们撰写本书的初衷有二:
全面解析Apache Spark:涵盖所有基本用例,并提供易于运行的示例。
深入探索“结构化”API:重点关注Spark
spark
11
2024-05-06
Spark权威指南英文版下载
《Spark权威指南》是一本详尽的英文指南,涵盖了2018年版的最新内容,供用户免费下载使用。
spark
7
2024-07-28
Apache Spark 2.1
Spark2.1 Hadoop2.6 ,涵盖 Spark Core 和 Spark SQL,是入门大数据分析的必备工具。
spark
7
2024-04-30
Oracle 12c R1官方安装指南PDF下载
Oracle 12c R1官方安装指南PDF提供了详尽的安装说明,是最权威和全面的安装指导手册。
Oracle
9
2024-07-27