研究论文基于Hadoop的K-Means聚类算法优化与实施

数据挖掘 16

361.18KB 2024-08-14

#聚类算法 # Hadoop # 大数据 # MapReduce

针对传统K-Means聚类算法在处理海量数据时的局限性进行了探讨，特别是其对异常离群点数据的敏感性。结合Hadoop云计算平台和MapReduce并行编程框架，我们提出了一种优化方案，以改善聚类效果和处理效率。