这份资源整理自厦门大学林子雨博士关于Spark的授课PPT,内容涵盖Spark核心概念、架构原理、生态系统组件等,并配有实际案例分析,帮助学习者全面系统地掌握Spark技术。
深入浅出Spark:厦门大学林子雨博士授课PPT分享
相关推荐
厦门大学林子雨老师主讲大数据教程优化版.rar
第1讲:大数据技术原理与应用-大数据概述.pdf 第2讲:大数据技术原理与应用-大数据处理架构Hadoop.pdf 第3讲:大数据技术原理与应用-分布式文件系统HDFS.pdf 第4讲:大数据技术原理与应用-分布式数据库HBase.pdf 第5讲:大数据技术原理与应用-NoSQL数据库.pdf 第6讲:大数据技术原理与应用-云数据库.pdf 第7讲:大数据技术原理与应用-MapReduce.pdf 第8讲:大数据技术原理与应用-基于Hadoop的数据仓库Hive.pdf 第9讲:大数据技术原理与应用-Hadoop再探讨.pdf 第10讲:大数据技术原理与应用-Spark.pdf 第11讲:大数据技术原理与应用-流计算.pdf 第12讲:大数据技术原理与应用-图计算.pdf 第13讲:大数据技术原理与应用-大数据在不同领域的应用.pdf
Hadoop
1
2024-07-16
Hadoop深入浅出
Hadoop 基础
分布式文件系统
Hadoop分布式文件系统 (HDFS) 是一种设计用于在商用硬件集群上存储大量数据的系统。HDFS具有高容错性,并提供对应用程序数据的可靠访问。
Hadoop MapReduce
MapReduce是一种编程模型,用于处理和生成大型数据集。这种模型将工作分为两个主要阶段:Map和Reduce。Map阶段处理输入数据并生成键值对。Reduce阶段接收所有映射器生成的键值对,并将它们聚合在一起以生成最终结果。
Hadoop YARN
Yet Another Resource Negotiator (YARN)是Hadoop的资源管理系统。它负责在集群中的不同节点上调度和管理资源,并确保所有应用程序都能获得所需的资源。
Hadoop
1
2024-05-20
深入浅出RAC
深入浅出RAC
本篇带你探索RAC的奥秘,从入门到精通,层层递进,揭开其神秘面纱。通过生动的案例和通俗易懂的语言,将复杂的概念化繁为简,助你轻松掌握RAC的核心思想和应用技巧。
Oracle
4
2024-05-23
深入浅出 SQL
深入浅出 SQL
这是一本以独特方式讲解 SQL 的书籍。
MySQL
2
2024-05-27
深入浅出Redis 2.0
Redis,全称远程字典服务器,是一款开源、高性能的键值对存储系统,广泛用于数据缓存、消息队列及数据库。其高效、灵活的特性使其成为Web开发社区的首选内存数据库。在“深入浅出Redis 2.0”中,我们将深入探讨以下核心内容:1. Redis的基本概念:包括字符串、哈希、列表、集合和有序集合等多种数据类型及其操作。2. 安装与配置:涵盖Linux、Windows和Mac OS等不同操作系统上的安装和基本配置。3. 命令操作:详细介绍GET、SET、HGETALL、HSET、LPUSH、RPOP、SADD、SMEMBERS、ZADD、ZRANGE等Redis丰富的命令集。4. 数据持久化:深入分析AOF和RDB两种持久化方式的优缺点及应用场景选择。5. 事务处理:简单事务操作的实现与应用。6. 发布订阅:Pub/Sub模式的原理与应用。7. 主从复制:数据安全性与可用性的提升。8. Sentinel哨兵系统:自动化监控与故障转移。9. Redis Cluster集群:分布式解决方案的部署与扩展。
Redis
0
2024-09-16
深入浅出OracleDBA学习与进阶案例分享
盖国强详细介绍了Oracle DBA的入门与进阶内容,并分享了实际诊断案例。
Oracle
0
2024-08-22
ORACLE深入浅出 - 初级篇
ORACLE深入浅出的主讲人是邹振兴。
Oracle
0
2024-10-01
深入浅出的数据挖掘课件
数据挖掘是从海量数据中提取有价值知识的过程,利用统计学、机器学习和人工智能等技术,揭示隐藏在数据中的模式、关联、趋势和规律。本课件深入探讨数据挖掘的基本概念、方法和技术,包括数据预处理、模式识别和结果解释等多个阶段。通过分类、聚类、关联规则学习、序列模式挖掘和异常检测等任务,帮助初学者理解数据挖掘的全貌和实际应用。学习者将掌握数据清洗、集成、转换、规约等关键技能,为解决市场分析、预测建模、用户行为分析等问题打下坚实基础。
数据挖掘
1
2024-07-16
深入浅出MATLAB编程(第2版)
专为初学者设计的全面指南,深入浅出讲解MATLAB。
Matlab
3
2024-05-01