针对传统K-Means聚类算法在处理海量数据时的局限性进行了探讨,特别是其对异常离群点数据的敏感性。结合Hadoop云计算平台和MapReduce并行编程框架,我们提出了一种优化方案,以改善聚类效果和处理效率。