半监督聚类技术近年来在数据挖掘和机器学习领域备受关注,尤其是在利用少量标签数据获得高精度聚类方面。然而,现有算法在处理极少标签和多密度不平衡数据集时的表现有限。基于主动学习技术改进了聚类算法,通过最小生成树聚类结合主动学习思想,选取信息丰富的数据点作为标签,并采用类KNN方法传播类标签。实验结果表明,新算法在UCI标准数据集和模拟数据集上展现出更高的聚类精度和稳定性。