在数据挖掘领域,聚类是处理数据初始阶段的重要方法。在动态系统中,随着新数据的不断增加,重新聚类既费时又浪费资源。首先介绍了聚类的基本概念和分类,然后提出了一种基于特征向量的增量聚类算法。该算法仅针对新增数据进行聚类,从而节省了大量资源和时间。通过实验比较了该算法与传统重新聚类方法在动态系统中处理新增数据的效果,验证了其可行性。
基于特征向量的动态增量聚类算法研究及设计(2012年)
相关推荐
研究联机增量聚类算法的探索(2004年)
探讨了在联机数据挖掘系统中并行和增量聚类算法的应用,并提供了算法的伪码。实验结果显示,相较于传统的Apriori算法,联机增量聚类算法具有显著优势,同时验证了增量聚类算法及其在联机数据挖掘系统中的实际效用。
数据挖掘
2
2024-07-18
基于特征向量的图像旋转算法
提供了一种利用特征向量实现图像旋转的算法,该算法可应用于多种图像处理场景。
Matlab
3
2024-06-01
基于Matlab的动态聚类文件
该压缩文件包含了模糊聚类的基础算法,其中包括多种建立模糊相似矩阵的方法供选择。
Matlab
0
2024-09-25
研究论文-基于K-means的有限增量聚类算法及其k值探讨.pdf
基于K-means的有限增量聚类算法及k值研究,姚文心,卢志国,聚类算法在数据挖掘、模式识别和信息抽取等领域广泛应用。随着互联网技术的进步,数据呈现动态增长特性。探索如何有效聚类动态数据是当前研究的关键问题。
数据挖掘
2
2024-07-29
基于快速聚类的髙维数据特征选择算法
这篇论文探讨了一种针对高维数据的特征选择算法,该算法利用快速聚类技术提高效率,为数据挖掘领域的学者和实践者提供了有价值的参考。
数据挖掘
2
2024-05-25
基于全局特征和核力场的时间序列聚类研究
聚类分析在时间序列数据挖掘中扮演着至关重要的角色,是众多领域应用的关键,例如医学图像分析、气象预测和金融市场分析等。然而,如何有效地对长时间序列进行聚类分析仍然是一个具有挑战性的课题。
本研究提出了一种基于全局特征和核力场的长时间序列聚类方法。该方法首先提取时间序列的全局特征,然后利用核力场对这些特征进行聚类。实验结果表明,该方法能够有效地对长时间序列进行聚类,并且具有较高的准确性和效率。
数据挖掘
4
2024-05-24
基于Web Services的分布式聚类算法设计与研究
在分布式数据挖掘领域,基于Web Services的分布式聚类算法设计与研究正成为重要的研究方向。由谢金辉和康利娟共同探讨了如何利用分布式数据和计算资源进行聚类分析,强调了Web Services在解决大规模数据处理问题中的作用。
数据挖掘
3
2024-07-18
论文研究-基于相容关系的新型聚类算法
聚类分析是数据挖掘中的重要研究领域,传统的聚类算法通常划分为硬聚类和模糊聚类两类。提出一种基于对象集上的相容关系的新型聚类算法,通过极大相容簇对数据对象集进行分类。该算法使得同一对象可以属于不同的簇,每个簇具有独特的成员对象,从而实现了既不同于传统硬聚类也不同于模糊聚类的聚类效果。实验结果进一步验证了该算法在聚类分析中的合理性。
数据挖掘
1
2024-08-04
基于SSE度量的K-means聚类算法聚类个数自适应研究
K均值聚类算法是数据挖掘中常见的无监督学习方法,其簇间数据对象越相异、簇内数据对象越相似,说明聚类效果越好。然而,确定簇个数通常需要有经验的用户设定参数。提出了一种基于SSE和簇的个数度量的自适应聚类方法(简称:SKKM),能够自动确定聚类个数。通过对UCI数据集和仿真数据的实验验证,结果表明改进的SKKM算法能够快速准确地确定数据对象中的聚类个数,提升了算法性能。
数据挖掘
2
2024-07-18