Apache Spark企业级实战版

spark 15

139.56MB 2024-05-13

#大数据 #Spark #Hadoop #并行计算 #数据挖掘

专为大规模数据处理设计
开源并行计算框架
继承Hadoop MapReduce优点
中间结果保存在内存，避免重复读写
适用于数据挖掘、机器学习等需要迭代的算法