本课程源于实际生产项目,所有代码在现网大数据集群上稳定运行,拒绝使用演示数据。课程详细覆盖了离线分析和实时分析的大多数应用场景,通过三个真实生产案例,深入探讨如何优雅地整合Hadoop、Spark、HBase、Kafka、Redis、MySQL等关键大数据技术,并实际应用于项目中。
Spark2.x企业级大数据项目实战实时统计、离线分析与实时ETL全解析
相关推荐
Spark企业级大数据项目实战指南
本指南从Spark基础概念出发,讲解其部署模式和搭建步骤,深入探讨RDD计算模型、创建和操作方法,并涉及分布式计算和机器学习等应用,帮助你实战运用Spark。
spark
3
2024-05-13
大数据Spark企业级实战详解
《大数据Spark企业级实战》详解了企业级Spark开发所需的技能,涵盖Spark架构、集群搭建、内核解析、SQL、MLLib、GraphX、Streaming、Tachyon、SparkR、多语言编程、问题及调优等。通过结合源码,本书深入解析了Spark内核和四大子框架,并提供了Scala快速入门实战内容。掌握本书内容后,读者将具备胜任大多数企业级Spark开发所需的知识。本书从实战出发,帮助读者从零起步学习Spark企业级开发所需的全部核心内容。
spark
3
2024-04-30
利用Flink与ClickHouse实现企业级实时大数据开发
最新升级版19章课程中,增加了Flink CDC的内容,覆盖Flink 1.12与ClickHouse 21.4.5.46的最新版本。Flink作为高薪大数据工程师必备技能,正迅速成为企业级大数据实时分析的首选工具。本课程从原理出发,通过案例驱动方式,系统讲解Flink开发的各个方面,同时引入ClickHouse作为热门OLAP引擎,帮助学习者构建完整的大数据实时分析应用。学习者将通过六大核心模块深入理解Flink,从而快速掌握并应用于实际项目中。
flink
2
2024-07-28
01大数据项目之Spark实时数据采集
本节内容将围绕大数据项目之Spark实时数据采集进行详细的知识点总结。离线计算是指通过批处理的方式计算已知的所有输入数据,数据在计算前已经全部就位,不会发生变化,数据量大且保存时间长,在大量数据上进行复杂的批量运算。实时计算是指通过流处理方式计算当日的数据,例如使用Spark Streaming等技术。实时计算需要通过代码,往往需要对接多种数据容器完成,相对开发较为复杂。
Hadoop
0
2024-08-08
企业级实时数仓代码参考
提供企业级实时数仓项目代码,供技术人员参考和学习。
flink
4
2024-05-12
Apache Spark企业级实战版
专为大规模数据处理设计
开源并行计算框架
继承Hadoop MapReduce优点
中间结果保存在内存,避免重复读写
适用于数据挖掘、机器学习等需要迭代的算法
spark
8
2024-05-13
Spark企业级大数据应用(一)
本书聚焦 Spark 在企业级大数据应用中的实践经验,深入浅出地讲解了 Spark 的核心概念、架构原理和应用技巧。本分卷作为系列的第一部分,将重点介绍 Spark 的基础知识、编程模型以及在数据处理和分析方面的应用案例。
spark
2
2024-06-30
构建企业级大数据平台:架构与实战
构建企业级大数据平台:架构与实战
本资源提供企业级大数据平台构建的完整指南,涵盖从基础架构设计到实用开发代码的全面内容。
核心内容:
大数据平台架构设计原则与最佳实践
主流大数据组件选型与集成策略(Hadoop、Spark、Kafka等)
数据采集、存储、处理、分析流程构建
平台安全、监控、运维体系建设
实用开发代码示例,加速项目落地
适用对象:
大数据架构师
大数据开发工程师
数据科学家
对大数据技术感兴趣的技术爱好者
Hadoop
2
2024-05-23
大数据企业级项目实战--Titan大型数据运营系统项目优化视频课程
大数据企业级项目实战--Titan大型数据运营系统项目课程,包含课件及代码下载。本项目课程全面涵盖互联网公司对海量用户浏览行为和业务数据分析的需求,以及企业数据管理和运营。
spark
0
2024-08-18