针对传统隐私保护方法无法应对任意背景知识下恶意分析的问题,本研究提出了在分布式环境中使用MapReduce计算框架实现的差分隐私保护k-means算法。该方法由主任务控制k-means迭代执行;Mapper分任务独立并行计算数据片中记录与聚类中心的距离,并标记其所属聚类;Reducer分任务计算同一聚类中的记录数量和属性向量之和,并利用Laplace机制生成的噪声扰动数据,实现隐私保护。理论证明该算法满足ε差分隐私保护的组合特性。实验结果显示,在提升隐私性和时效性的同时,保证了算法的可用性。