针对海量用电数据的挖掘效率低下等问题,本研究采用理论分析与实验相结合的方法,提出了一种新的并行处理算法。首先,利用Canopy算法对数据进行初步处理,确定聚类个数和中心点;随后,采用K-means算法进行精确聚类,兼顾了算法简单且收敛速度快的优势,避免了局部最优解的问题。为验证算法的效果,我们将其部署到MapReduce框架上进行了实验,结果表明,该算法在处理海量用电数据方面表现出高效和可行性,且具备显著的加速效果。