Apache Spark 2.2.x的中文官方参考手册(非API文档)。本教程简要介绍如何使用Spark。首先,我们将通过Spark的交互式shell介绍(Python或Scala) API的基础知识,然后演示如何使用Java、Scala和Python编写Spark应用程序。
Apache Spark 2.2.x中文手册
相关推荐
Apache 2.2 中文手册
Apache 2.2 版本特性、升级指南、许可证、编译与安装、运行时配置、指令速查、模块、过滤器、处理器、多路处理模块、用户指南、配置、内容缓冲、内容协商、动态共享对象、日志文件、映射、性能调整、安全提示、SSL 加密、CGI 执行、URL 重写、虚拟主机、认证、CGI、.htaccess、SSI、用户目录、平台说明、常见问题解答、开发者文档
Access
10
2024-05-16
Apache2.2 中文文档
Apache2.2 文档提供了 Apache 2.2 版本的新特性、指令、模块、MPM、过滤器、处理器、词汇表、用户指南、配置、性能调整、安全提示、SSL/TLS、CGI、URL 重写、虚拟主机、认证、授权、访问控制、CGI、SSI、用户网站目录管理和特定平台说明等信息。
Access
8
2024-05-26
Apache Spark学习手册
Apache Spark是Apache软件基金会下的一款开源大数据处理框架,以其高效、灵活和易用性著称。Spark学习手册的目的是帮助用户深入理解Spark的核心概念、工作原理以及在实际项目中应用Spark进行数据处理的方法。以下是每个文件内容的详细解读: 1. 01Spark生态和安装部署.pdf Spark生态系统包括多个组件,如Spark Core、Spark SQL、Spark Streaming、MLlib(机器学习库)和GraphX(图处理)。件介绍了在各种环境(例如本地、Hadoop YARN、Mesos或Standalone集群)中安装和配置Spark的方法,还包括配置参数调整
spark
5
2024-10-13
Apache Spark 中文版
Apache Spark 是一款开源的集群计算框架,专为大规模数据处理设计。它继承了 Hadoop MapReduce 的优点,并优化了内存管理,使数据迭代算法更有效率,广泛应用于数据挖掘、机器学习等领域。
spark
10
2024-05-12
掌握Apache Spark 2.x第二版
《掌握Apache Spark 2.x第二版》是一本英文书籍,帮助读者快速入门并掌握Spark的基础知识。作为一款大数据工具,Spark对于工程技术人员来说是必备的学习资源。
spark
8
2024-08-13
Apache Spark 2.x Java开发者指南
《Apache Spark 2.x Java开发者指南》详细介绍了如何利用Apache Spark 2.x进行Java开发。Apache Spark是一个快速、通用的集群计算系统,支持Java、Scala、Python和R的高级API,本书专注于Java开发者,涵盖了Spark Core、Spark SQL、Spark Streaming、MLlib和GraphX等关键模块。读者将学习如何使用Spark进行大数据处理,包括RDD的管理、DataFrame的数据操作、SQL查询、流处理等关键技术。
spark
5
2024-10-22
Apache Spark 2.1
Spark2.1 Hadoop2.6 ,涵盖 Spark Core 和 Spark SQL,是入门大数据分析的必备工具。
spark
7
2024-04-30
Apache Spark 备忘单
Apache Spark 已成为提升 Apache Hadoop 环境的各种功能的引擎。对于大数据,Apache Spark 满足了许多需求,并本机运行在 Apache Hadoop 的 YARN 上。通过在 Apache Hadoop 环境中运行 Apache Spark,您可以获得该平台固有的所有安全、治理和可扩展性。Apache Spark 还与 Apache Hive 非常好地集成,并且利用集成安全功能可以访问所有 Apache Hadoop 表。
spark
12
2024-04-30
Apache Spark 图处理
Apache Spark 图处理,一种处理大规模图数据的解决方案。
spark
8
2024-04-30