当前的聚类方法如K-means和DBSCAN采用全局参数,难以准确发现数据的自然聚类结构。新提出的分级聚类算法CluFNC通过调整网格大小、噪声阈值和神经节点数量,能够在数据空间中精确识别内部聚类特征。该算法首先根据参数划分数据空间网格,然后利用高斯影响函数计算每个单元的场强,接着运用SOM算法对网格位置和场强进行聚类,最后通过Chameleon算法对SOM聚类得到的神经网络节点权值进行最终的数据空间聚类映射。理论和实验结果表明,该算法能有效发现数据中的自然聚类特性。
研究论文-一种自然聚类发现的新算法.pdf
相关推荐
一种新型全局孤立点识别方法-基于层次聚类的创新研究.pdf
针对现有的孤立点检测算法在通用性、有效性、用户友好性及处理高维大数据集的性能还不完善,提出了一种快速有效的基于层次聚类的全局孤立点检测方法。该方法利用层次聚类结果,通过聚类树和距离矩阵可视化评估数据的孤立度,并确定孤立点数量。从聚类树顶层开始,无监督地去除孤立点。仿真实验验证了本方法能快速有效地识别全局孤立点,具备良好的用户友好性,适用于不同形状的数据集,特别适用于大型高维数据集的孤立点检测。
数据挖掘
5
2024-07-16
Kmeans聚类算法改进研究.pdf
Kmeans算法在模式识别和数据挖掘等领域应用广泛。针对高维度数据聚类效果差的问题,李森林和蒋启明提出了一种改进方法。
数据挖掘
5
2024-04-30
论文研究-基于相容关系的新型聚类算法
聚类分析是数据挖掘中的重要研究领域,传统的聚类算法通常划分为硬聚类和模糊聚类两类。提出一种基于对象集上的相容关系的新型聚类算法,通过极大相容簇对数据对象集进行分类。该算法使得同一对象可以属于不同的簇,每个簇具有独特的成员对象,从而实现了既不同于传统硬聚类也不同于模糊聚类的聚类效果。实验结果进一步验证了该算法在聚类分析中的合理性。
数据挖掘
1
2024-08-04
一种高效挖掘最大频繁模式的新算法(2006年)
挖掘最大频繁模式是多种数据挖掘应用中的关键问题。提出一种新算法,利用前缀树压缩数据存储,并通过深度优先策略直接在前缀树上进行挖掘,避免了条件模式树的创建,大幅提升了挖掘效率。该算法调整节点信息和节点链,采用高效的策略处理数据集,以应对大规模数据挖掘的需求。
数据挖掘
0
2024-08-31
Jaya一种创新的优化算法
介绍了一种简单但强大的优化算法,适用于解决有约束和无约束的优化问题。所有基于进化和群体智能的算法都是概率算法,需要共同的控制参数,如种群规模、世代数、精英规模等。不同的算法除了共同的控制参数外,还需要特定的算法参数。例如,GA使用变异概率、交叉概率和选择算子;PSO使用惯性权重、社会和认知参数;ABC使用围观蜂数、雇佣蜂数、侦察蜂数和限制数;HS算法使用和声记忆考虑率、音调调整率和即兴次数。其他算法如ES、EP、DE、SFL、ACO、FF、CSO、AIA、GSA、BBO、FPA、ALO、IWO等也需要对各自的特定参数进行优化。算法特定参数的适当调整对算法性能非常关键,而不当的调整可能导致计算量增加或局部最优解。为解决这一问题,Rao等人(2011)引入了基于教学的优化(TLBO)算法,该算法无需特定于算法的参数,只需要通用的控制参数,如种群大小。
Matlab
0
2024-09-25
一种革新的量子遗传算法_张宗飞.pdf
量子遗传算法结合了量子计算和遗传算法的优点,特别适用于复杂多峰连续函数的优化问题。传统的量子遗传算法在这些问题上可能会陷入局部最优解或收敛速度较慢,为了克服这些问题,提出了一种改进型量子遗传算法(Novel Improved Quantum Genetic Algorithm,NIQGA)。该算法通过动态调整量子门的旋转角度θ,加速了收敛速度,并引入优体交叉策略以增强局部搜索能力。改进型量子遗传算法的优势在于能够有效提高全局寻优效率,避免陷入局部极值。文章首先介绍了量子遗传算法的基本机制,包括种群更新和染色体交叉,然后详细描述了改进型算法中的动态策略和优体交叉策略的应用。测试结果表明,该算法在复杂连续函数优化中表现出了较快的收敛速度和优秀的局部搜索能力。
算法与数据结构
0
2024-09-14
论文研究-基于工程力学与有限元分析的聚类算法.pdf
基于工程力学与有限元分析的聚类算法,王清江,张宪超,聚类是数据挖掘中重要的技术之一,广泛应用于市场分析、金融预测、卫星图像处理等领域。然而现有的聚类算法大多集中于距离度量和数据点分布。
数据挖掘
2
2024-07-16
研究论文-基于K-means的有限增量聚类算法及其k值探讨.pdf
基于K-means的有限增量聚类算法及k值研究,姚文心,卢志国,聚类算法在数据挖掘、模式识别和信息抽取等领域广泛应用。随着互联网技术的进步,数据呈现动态增长特性。探索如何有效聚类动态数据是当前研究的关键问题。
数据挖掘
2
2024-07-29
研究论文改进频繁模式聚类算法以优化网站结构
分析了现有频繁模式聚类算法存在的问题,并提出了改进距离函数。在基于模式聚类函数的基础上,引入了压缩偏序算法(FCWSO算法)。实验表明,该算法能够高效、高质量地压缩频繁序列模式,生成更为精简、信息量更大的模式,从而提升发现频繁访问序列的效果。
数据挖掘
0
2024-09-14