Spark共享变量——累加器(accumulator)与广播变量(broadcast variable)广播变量累加器RDD持久化Spark中的checkpoint作用与用法Spark的运行模式任务提交宽赖窄依赖Spark任务调度Spark是大数据处理领域的一款高效、易用的计算框架,它提供了丰富的编程模型,支持批处理、交互式查询、流处理等多种计算场景。本篇笔记主要探讨Spark中的共享变量、RDD持久化、checkpoint机制、运行模式以及任务调度等相关知识点。