Kmeans算法是无监督学习中的经典聚类方法,用于将已知数据集分组和划分,广泛应用于图像处理、数据挖掘及生物学领域。随着数据规模的增大,对Kmeans算法性能提出了更高要求。本研究在考虑不同硬件平台架构差异的基础上,系统研究了Kmeans算法在GPU和APU平台上的优化关键技术,包括片上全局同步高效实现、减少冗余计算、线程任务重映射和局部内存重用等,以实现在不同硬件平台上的高性能和性能移植。实验结果显示,优化后的算法在大规模数据处理方面表现出卓越的性能。