本大数据Spark实战视频培训课程包括Spark虚拟机安装、表配置、平台搭建、Scala入门、集群通信、任务调度、持久化等实用内容。Spark是由加州大学伯克利分校AMP实验室开源的通用并行框架,与Hadoop MapReduce相比,Spark能够将中间输出结果保存在内存中,无需频繁读写HDFS,因此更适用于数据挖掘和机器学习等迭代算法。